発音と音声学
MediaVOCSは、誤って発音されがちな名称を正しく認識させるため、名称の代替候補と音声変換を集めた独自データベースを用いて、ASRとTTSによる制限を軽減します。このASRとTTSという技術は、デジタル分野では目新しいものではなく、また、いずれも音楽分野で典型的な固有名称や単語の複雑さを解決しようとデザインされたものではありません。一般的な音声技術は、著名なアーティストや楽曲名、アルバムタイトルやジャンルといった名称を、必ず認識したり発音したりできるわけではありません。音楽で使用される名称には、民族や文化に由来する名詞、短縮形、あだ名や造語といった本来の発音や通常の言語にかかるルールを無視した、一般的とは言い難い単語がかなり頻繁に含まれているのです。
聴きたい1曲を探し出すには
MediaVOCSは、Gracenote Media Management Systemと統合することにより、音声コマンドを処理するための機能を持つだけでなく、膨大なデジタルミュージックを保存するためのデバイスに新たな機能を追加することができます。たとえば、小さな画面と限られた操作方法しか持たない小型デバイス用グラフィックユーザインターフェース(GUI)では、自転車などを運転している時に数千もの音楽コレクションの中から1曲を探し出すことはできず、そういった時にこのMediaVOCSが力を発揮するのです。
MediaVOCSは下記を音声コマンドにて可能にしました:
*楽曲、アルバム、アーティストおよびジャンルの名称からの即時検索
-その名称を口にするだけで、コレクションにおける楽曲、アルバム、アーティストおよびジャンルを再生できます。
*新しいミックスリストの作成
-現在再生している楽曲の雰囲気を備えたMore Like Thisプレイリストをその場で生成します。
-聴きたい音楽の属性を単語で(例:「60年代のデトロイトソウル」)声に出すことで、新しい"On-The-Fly(即席)" ミックスができあがります。
*アーティスト情報や楽曲情報の入手
-単に「この曲は何?」と声に出すことで、現在聞いているお気に入りの楽曲に関する情報を入手できます。
音声変換データ
MediaVOCSは、楽曲名や専門用語を正確に認識し発音することのみならず、しばしば間違って発音されがちな下記のような名称を認識するために必要不可欠な音声変換データを提供します。
*アーティスト名:"Sade" ("shah-DAY<シャーディ>"), "Bjork" ("bee-YORK<ビョーク>"), 311 ("three-eleven<スリーイレブン>"), "Aaliyah" ("Uh-LEE-uh<アリーア>"), "Chic" ("sheek<シーク>")
*アルバム名および楽曲名:"Aja" ("A-zjyah<アジャ>"), "808 State" ("eight-oh-eight state<エイト・オー・エイト・ステート>"), "The Girl from Ipanema" ("ee-puh-NEE-muh<イパネマ>").
*ジャンル名:Merengue ("muh-RANG-gay<ムランゲィ>")
Phonetic Variantsによる各種呼び方への対応
世界中の音楽ファンは、バンドやアーティストの名前を独自の方法で発音しがちです。Phonetic Variantsは、下記の例を含めて幅広い発音も正しく認識することができます。
*アーティスト名:Gloria Estefan ("eh-STAY-fan<エスティファン>"または"EH-stah-fan<エスタファン>")
*アルバムおよび楽曲名:D'yer Mak'er ("dja-MAY-ka<ジャメイカ>"または"DI-yer-MAK-er<ディヤメイカー>")
*ジャンル名:Quebecois ("ke-be-KWAH<ケベクヮ>" または "KWE-be-koy<クェベコ>")
別名への対応
Elvis Presley(エルビス・プレスリー)は、「The King」などの他の名前で呼ばれることでも有名です。MediaVOCSは、そのようなアーティストやバンドの、複数のあだ名や通称についても対応しています。
* アーティストのニックネーム: "The Fab Four" (The Beatles), "The King" (Elvis Presley), "Ol' Blue Eyes" (Frank Sinatra), "The Stones" (The Rolling Stones)
* アーティスト名の短縮形: "Dylan" (Bob Dylan), "Aretha" (Aretha Franklin), "Mozart" (Wolfgang Amadeus Mozart)
* アーティスト名の省略形: "CCR" (Creedence Clearwater Revival), "BTO" (Bachman Turner Overdrive)
* アルバムタイトルのニックネーム: "Zep Four", "Zoso", "Black Dog", "Runes" (Led Zeppelin のタイトルがついていない4枚目のアルバム), "The White Album" (The Beatles の歌手名がそのままタイトルになったアルバム)
* 楽曲名のあだ名: "Chestnuts Roasting Over an Open Fire" ("The Christmas Song"), "N.I.B." (Black Sabbath の "Nativity in Black")
音楽を管理し、楽しみ、そして新たな発見をすることができる進化した音声コマンド
ほんの数単語を口にするだけで、お気に入りの楽曲やアルバムを再生でき、さらに感じるままの雰囲気に応じたプレイリストが自動的に作成されます。MediaVOCSは、Gracenote Music ID、Playlist、Playlist PlusおよびLinkと連携して、音声でのGracenote機能操作を可能とするのです。以下に掲げるのは、音声コマンドの一例です。
* MusicID:
- 条件検索: "これは何?" "このアーティストは誰?" "楽曲名は何?" "この曲の発表年はいつ?"
- 特殊再生: "アーティスト'Bowie'の曲を再生" "タイトル名'Fame'を再生" "一時停止" "もう一度再生"
* Playlist / Playlist Plus:
- プレイリストの自動生成: "More Like This?(こんな感じの曲)" "このアーティストに似たアーティストの曲" "このエリアの他の曲" "この曲と同年に発表された曲" "50年代のジャズ" "女性デュオの曲"
* Link:
- Linkサービス: "着信音の購入" "評論を読む" "アルバムのダウンロード" "コンサートチケットの購入"
* ナビゲーション:
"1982年の楽曲一覧表示" "フランス人アーティスト一覧の表示" "ブルースのアーティスト一覧の表示"