課題

音声技術の進歩により、この音響機器の世界的なリーディングプロバイダーでは自社プロダクトの試験を行うためにASRautomatic speech recognition、自動音声認識)モデルの開発を考えていました。ところが、従来のデータベンダーでは適切なツールも、ターゲット層を代表する多様性を持った十分な数の人々も提案されませんでした。当社の210,000を超える世界規模のコミュニティと、業界をリードするエンタープライズポータルを使用するDefinedCrowd®は、同社のニーズに対応できる理想的なソリューションでした。

クライアントが必要とするのはASRシステムのトレーニングに使用する高品質なデータです。データは「繰り返し再生」のような単純な音声システムコマンドから「レストランを探して」のようなより完全なアシスタント要求まで多岐にわたり、またこれらは静かな屋内環境で行われる場合もあれば、背景雑音のある移動中の車内で行われる場合もあります。このシステムは、「音を大きくして」と「音量を上げて」などの同じ要求に対する表現のばらつき、アクセントやその他の発声に影響する要素について理解することが求められていました。

ASRシステムの学習において、使用するデータの品質は、正しい結果を得るために非常に重要な役割を担っています。