
複数のクラウド音声認識サービスを比較評価できるUIを構築
音声認識サービスの選定に悩む企業向けに、複数のクラウド音声認識APIを一括でテスト・比較できるWeb UIを開発。人の目による比較だけでなく、読み上げ元の文章との類似度を自動計算することで、定量的な評価が可能な仕組みを実現しました。
課題と背景
近年、クラウドベースの音声認識サービスが数多く登場していますが、それぞれの精度や特性が異なるため、どのサービスを選択すれば良いか分からないという課題がありました。特に、企業が自社の業務用途に最適なサービスを判断するには、実際に試して比較する必要があり、多大な手間と時間がかかっていました。
ご提案内容
複数の音声認識サービスを同時に呼び出し、その結果を並列表示できる専用のUIを構築しました。ユーザーが一つの音声を入力するだけで、各サービスの認識結果を一覧で比較できるようになっています。さらに、元の読み上げ文章と各サービスの認識結果との類似度を自動で算出・表示する機能も追加し、主観的な判断だけでなく、数値に基づいた客観的な評価も可能にしました。
導入の効果
この仕組みにより、各音声認識サービスの特徴や精度を効率的に比較・評価できるようになり、最適なサービスの選定が迅速かつ確実に行えるようになりました。また、音声認識の精度向上やコスト最適化にもつながる判断材料が得られるため、音声技術を活用した業務改善の検討がスムーズに進むようになりました。