reCAPTCHA
reCAPTCHAとは
reCAPTCHAとは、ウェブサイトの制限エリアへのアクセスを試みるボットからサイトを防御するためCAPTCHAを利用するのと同時に、そのCAPTCHAに対する返答を紙の本のデジタル化に活かすシステムである。オリジナルは2007年にカーネギーメロン大学ピッツバーグ本校にて開発された。2009年9月16日にGoogleはこのテクノロジーを買い取っている。
現在reCAPTCHAはニューヨーク・タイムズが持つ記事アーカイブの電子化及びGoogle ブックスの書籍電子化に利用されている。前者は2009年の時点で、130年分を超えるという全記事のうち約20年分のデジタル化を2、3ヶ月で完了しており、残余は2011年末までの完了を目指していた。
reCAPTCHAは、OCRソフトウェアが読み取れなかった文字を画像として出力し、reCAPTCHAのデータを受信する各購読サイトへ向けてそれらを割り振る。購読サイトは、書籍デジタル化プロジェクトとは概ね無関係なサイトが多いが、これらの文字を含む画像を人間に差し出して、通常通りの認証手順の一部としてCAPTCHAの文字列を解読させる。そしてreCAPTCHAサービスは解答されたデータをデジタル化プロジェクトへ送信する。
インターネット上では日々2億超のCAPTCHAが表示されているとの報告があり、このリソースを活用しようと、Facebook、チケットマスター、4chan、CNN.com、及びStumbleUpon(英語版)などの有名サイトはこのreCAPTCHAプログラムに2007年より、及びCraigslistは2008年6月より参加している。その他政府機関のウェブサイトでも使われることがあり、米国の国家電気通信情報管理庁(英語版)は、2009年に完了したデジタルテレビ放送への移行(英語版)の際に、クーポン資格型変換ボックス(英語版)(Coupon-eligible converter box, CECB. いわゆるデジアナ変換機)用のクーポン申し込みサイトにてreCAPTCHAを採用していた。
- 出典: フリー百科事典『ウィキペディア(Wikipedia)』
- [ reCAPTCHAの改定履歴 ]










