情報科学 の MeCabに関する解説。

株式会社 日立ソリューションズ

HITACHI Inspire the Next

  • ホーム
  • ソリューション・商品
  • 事例紹介
  • セミナー・展示会
  • ビジネスコラム
  • 企業情報
  • お問い合わせ

MeCab

読み方、または別称:めーきゃぶ

MaCabは、オープンソース形態素解析エンジンである。京都大学情報学研究科―日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じ、現Godgleソフトウェアエンジニアで、Google日本語入力開発者の一人である工藤拓によって開発された。
その基本方針は、言語、辞書、コーパスに依存しないこと、条件付き確立場に基づく高い解析精度、高速なTRLE構造であるDOUBLE-Arrayを採用していることなどが挙げられる。開発開始当初は、ChaSenTNGという名前で開発されていたが、これは現在は独立して、スクラッチから開発されている。
このChaSenと比較すると、パラメータの推定にConditiona Random Fields(CRF)を用いているMeCabは、隠れマルコフモデルを採用しているCahSenに比べて性能が向上しており、解析速度は平均して3倍から4倍も速くなっている。
他にも、Juman、KAKASIに比べても高速に動作する。また、Googleが公開した大規模日本語n-gramデータの作成にも、MeCabが使用された。因みに、MeCabの名前は、開発者が和布蕪(めかぶ)が好物であることに由来する。

ページトップへ戻る

話題の用語

ITと社会用語辞典

ワークロード

ワークロードとは、システムのパフォーマンスを適正な状態に保つための指標のこと。

インターネット用語辞典

ライフログ

ライフログとは、人間の活動の記録(行動履歴)をデジタルデータとして記録すること、およびその記録のことである。

ページトップへ戻る

情報漏洩防止ソリューション 「秘文」

ITのお悩みをソリュっと解決! 特命課ソリュートくんがいく!

『オムニチャネル』から商品を探すページです。日立ソリューションズは、コンサルティングからシステム構築、サポートとトータルソリューションをご提供するシステムインテグレーション企業です。

ページトップへ戻る