中国政府が人工知能(AI)を活用してインターネット上の検閲を強化していることが、流出したデータから明らかになりました。このデータは、従来のタブーとされる話題に加え、環境問題や食品安全、政治風刺など多岐にわたる内容を自動的に検出するシステムの存在を示しています。
流出したデータセットには、約13万3千件の事例が含まれており、AIモデルが自動的に「敏感」と判断する内容が詳細に記録されています。これらの事例には、農村部の貧困に関する苦情や汚職に関する報道、警察の不正行為に関する訴えなどが含まれています。このシステムは、従来の人手によるキーワードフィルタリングや手動レビューに比べ、検閲の効率と精度を大幅に向上させると考えられます。
このデータセットは、セキュリティ研究者のNetAskari氏によって発見され、TechCrunchに共有されました。データは、Baiduのサーバー上に無防備な状態で保存されていたとされています。具体的なシステムの開発者や運用主体は明らかになっていませんが、最新の記録は2024年12月のものであり、比較的最近のものであることが分かります。
カリフォルニア大学バークレー校の研究者で、中国の検閲を研究しているシャオ・チアン氏は、TechCrunchに対し、「このデータは、中国政府またはその関連機関がLLM(大規模言語モデル)を活用して情報統制を強化しようとしている明確な証拠である」と述べています。さらに、「従来の検閲手法に比べ、LLMを活用することで、国家主導の情報統制の効率と詳細度が大幅に向上する」と指摘しています。
このようなAI技術の活用は、権威主義的な体制が最新のテクノロジーを迅速に取り入れていることを示しています。2025年2月には、OpenAIが複数の中国組織がLLMを使用して反政府的な投稿を追跡し、中国の反体制派を中傷していることを明らかにしています。(Source)
コメント
キーフード検閲から、そのまま思想検閲になったってこと?中国ってほんとに怖いね。