2022 年 12 月 14 日水曜日、Google は、SpamBrain と呼ばれる AI を利用したスパム対策システムのアップデートを発表しました.このアップデートでは、SpamBrain を使用して、検索結果の異常なリンクの影響を検出して排除します.この更新プログラムの展開には 2 週間かかると予想され、すべての言語に影響します。これにより、これらの異常なリンクから信用が失われるため、ランキングが変動する可能性があります。
Google は、検索ランクのなりすましによって取得されたリンクはスパム リンクと見なされることを一貫して強調してきました。このアップデートでアルゴリズムと手動アクションは、これらの異常なリンクを大規模に覆すように設計されています。ユーザーが不自然なリンク構築を含むサイトに遭遇した場合Google に直接報告できます。この更新について具体的に説明してください。ユーザーは、Google の ヘルプ コミュニティ にメッセージを投稿できます。
この投稿では、Duy Nguyen、Ildar Akhmedyanov、Jacob N Scott、および Karthikgeyan Elangovan が、ハイ パフォーマンス コンピューティング (HPC) の機械学習操作をスケーリングする方法について説明します. 機械学習で使用されるより多くのデータとモデルの数.したがって、HPC システムは、より大きなコンピューティング リソースを活用する必要があります。典型的な HPC セットアップについて説明し、分散トレーニングを有効にする方法について説明します。
著者は、パフォーマンスを向上させるためにデータ パイプラインを最適化する方法に関するヒントも提供します。重要なステップの 1 つは、データが計算ノードに送信される前に前処理されていることを確認することです。これにより、ネットワークのオーバーヘッドが削減され、ノードが最高のパフォーマンスで実行されるようになります. また、分散トレーニングに TensorFlow や PyTorch などのフレームワークを使用することの重要性についても説明しています.これらはモデルを並列化するための最適化された方法です。
最後に、著者は、大規模な機械学習タスクの処理に使用できる、Apache Spark や Kubernetes などの一般的な HPC システムの概要を説明します。彼らは、今日のビッグデータと複雑なモデルの世界で機械学習操作をスケーリングするには、HPC システムが不可欠であると述べて結論付けています。