アルゴリズム の tf-idfに関する解説。

株式会社 日立ソリューションズ

HITACHI Inspire the Next

  • ホーム
  • ソリューション・商品
  • 事例紹介
  • セミナー・展示会
  • ビジネスコラム
  • 企業情報
  • お問い合わせ

tf-idf

読み方、または別称:てぃーえふあいでぃーえふ

tf-idfとは主に情報検索や文章要約などの分野で使われる、文書中の単語に関する一種である。tf-idfのtfは単語の出現頻度を、idfは逆文書頻度を意味し、これら2つの指標に基づいて計算される。
また、tf-idf内にある「tf(term frequency)」は、文書の中で特定の単語が出現いた回数を、「idf(inverse do cument frequency)」はコーパス全体の中で文書を含んだ文書数の自然対数を表す。
よって、「tf×idf」がその文書中におけるその単語の“tf-idf”となる。重み付けを利用したアルゴリズムのことは、“tf-idf法”と呼ばれている。これは、キーワードの抽出や全文検索エンジンの重みづけなどに応用され、ベクトル空間モデルにおいても用いられることが多い。
情報検索とは、コンピュータを使い、大量のデータ群から目的に合ったものを取り出し、情報を人間が直接管理するのに比べ、データ量的な制約やデータの取り扱いの一貫性を保つ困難さを受けずに、また高速で安定したシステムよりも利用者に適切なデータを提供する機能と位置づけになっている。

ページトップへ戻る

話題の用語

ITと社会用語辞典

ワークロード

ワークロードとは、システムのパフォーマンスを適正な状態に保つための指標のこと。

インターネット用語辞典

ライフログ

ライフログとは、人間の活動の記録(行動履歴)をデジタルデータとして記録すること、およびその記録のことである。

ページトップへ戻る

情報漏洩防止ソリューション 「秘文」

ITのお悩みをソリュっと解決! 特命課ソリュートくんがいく!

『オムニチャネル』から商品を探すページです。日立ソリューションズは、コンサルティングからシステム構築、サポートとトータルソリューションをご提供するシステムインテグレーション企業です。

ページトップへ戻る