この記事では、オープンソース形態素解析エンジンである「MeCab(めかぶ)」をMacにインストールする方法を解説します。
形態素解析(けいたいそかいせき)とは?
形態素解析とは、ある文章・フレーズを「意味を持つ最小単位(=形態素)」に分解し、内容を判断するために用いられる。
MeCabを使うことで簡単に形態素解析が可能です。
公式MeCab: Yet Another Part-of-Speech and Morphological Analyzer
MeCabをMacにインストールするには Homebrew
を使うと簡単です。
公式macOS(またはLinux)用パッケージマネージャー — Homebrew
Homebrew
をインストールしてない方は、以下の記事を参考にインストールしてください。
MeCabをインストールするには、ターミナルで以下のコマンドを実行します。
brew install mecab
次にMeCabで使用する辞書をインストールします。
使用できる辞書は以下の3つです。
どういう辞書なのか気になる方は以下の記事が参考になります。
ここでは推奨されている「IPA辞書」をインストールします。
ターミナルで以下のコマンドを実行してください。
brew install mecab-ipadic
これでMeCabが使用可能な状態になりました。
MeCabを使用するにはターミナルで「mecab」と入力して実行します。
mecab
すると、入力待ちの状態になるので解析したい文を入力して実行します。
% mecab
隣の客はよく柿食う客だ
隣 名詞,一般,*,*,*,*,隣,トナリ,トナリ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
客 名詞,一般,*,*,*,*,客,キャク,キャク
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
よく 副詞,一般,*,*,*,*,よく,ヨク,ヨク
柿 名詞,一般,*,*,*,*,柿,カキ,カキ
食う 動詞,自立,*,*,五段・ワ行促音便,基本形,食う,クウ,クウ
客 名詞,一般,*,*,*,*,客,キャク,キャク
だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ
EOS
今回は「隣の客はよく柿食う客だ」を解析してみました。上記のように名詞や助詞で区切られ、読みや発音などが表示されます。
この記事では、「MeCab(めかぶ)」をMacにインストールする方法を解説しました。
これでMeCabを使って形態素解析できるようになりました。オプションを使えば「わかち書き」や出力フォーマットを変更したりすることができます。
公式MeCab: Yet Another Part-of-Speech and Morphological Analyzer
それでは今回の内容はここまでです。ではまたどこかで〜( ・∀・)ノ