微軟中國研究院說談必應辭典的幕后事

2010/11/14 19:14:55    編輯:軟媒 - 笨笨     字體:【

Win7之家www.airtaxifl.com):微軟中國研究院說談必應辭典的幕后事

文章來源:新京報

  近期的“微軟創(chuàng)新日”活動展示了微軟研究院以及它和高校合作完成的各種科技發(fā)明,顯示出蓬勃的創(chuàng)造力。很多產品都不是拍拍腦袋就可以做出來的,它們之中既包含有聰明的創(chuàng)意,簡單的技術應用,也包含有艱深的數(shù)學運用和豐富的人文內涵。微軟研究院是如何組織實現(xiàn)這些技術發(fā)明的?帶著這個問題,記者采訪了微軟亞洲研究院院長洪小文博士。他向記者講述了“必應詞典”的研發(fā)過程。

  1 成果 網絡詞典會“說話”

  當你進入“必應”的網址后,你會發(fā)現(xiàn)在輸入欄上方的選擇欄的右邊有一項是“詞典”。點開之后,在輸入欄中輸入一個英文單詞,不僅可以看到下面的英文解釋,更下面還有相應的英中對照的例句。洪小文說,這些例句都是電腦自動找出來,機器翻譯的,有的加入了一定的人工修改。它們以“靠譜程度”為標準排列,最靠譜的句子排在最前面。在排列在前面的句子后面,通常會有一個小喇叭標志和一個小電視標志。點擊小喇叭標志,會有一個男聲給你朗讀這個句子。洪小文說,這個聲音完全是機器讀出來的。記者感覺讀音和真人語音的相似程度相當高。而點擊小電視標志,會出現(xiàn)一段視頻,一個長得相當“萌”的小伙子會為你讀這句話,不但聲音很像真人,而且口型也分毫不差,但這段視頻也是機器合成的。

  2 開端 幫助寫作的“愿景”

  “必應詞典”是一款功能豐富強大的軟件,并且通過汲取網絡資源而變得越來越強大。洪小文說,“必應詞典”的前身是微軟亞洲研究院的“英庫”項目。那么,這個項目是如何開始的呢?

  洪小文說,微軟研究院(包括微軟亞洲研究院等6家研究院)提倡“以情境驅動的研究”,人們先提出一個關于未來的“愿景”,然后通過自己或者多人合作研究來實現(xiàn)這個“愿景”。比如說洪小文領導的“英庫”項目,開始的時候就是自動機器翻譯、自然語言理解的學術研究。大概五六年前,洪小文和一些同事覺得這個技術越來越好了,于是把自己寫作時的情境加進去,開始開發(fā)一個應用軟件。

  記者對此非常感興趣的是:“情境”也好,“愿景”也好,都摻雜有復雜的情況和人類的感情,如何把它用科學的語言描述出來,寫進一個項目申請計劃書呢?洪小文的回答出乎記者的意料:根本沒有這樣的計劃書!

  洪小文說,微軟研究院的研究項目都沒有正式的計劃書,也不用申請經費。一般來說,幾個人在喝茶喝咖啡的時候提出一個想法,有興趣就可以做,領導只提供意見。微軟亞洲研究院的員工不吃“科研經費”,他們有固定工資,領導還會獎勵他們的成果。

  3 過程 如何排除“雷人英語”

  英庫也是一樣,沒有正式的項目申請書,它開始得很自然,就是幾個人為了解決自己英文寫作時遇到的問題。英文和中文互相轉換的問題很多,這些問題被分解,一一解決。比如說,英文每一個字都有一個空格,中文的字都是連著的,所以中譯英時如何“斷句”就是個大問題。比如說“一次性”被翻成了“one time sex”,這就是因為把它錯誤地斷成了“一次”和“性”。借助“自然語言理解”的研究成果,可以比較好的完成這個“斷句”的工作。

  運用微軟研究院一直在搞的數(shù)據挖掘技術,“英庫”的研發(fā)者把網上所有有中英對照的句子收集起來,通過分析這些句子,可以做一套模型。這樣,自動機器翻譯、自然語言理解和數(shù)據挖掘等技術就天衣無縫地結合起來。

  4 升級 可愛小伙視頻現(xiàn)身

  那么,那個很“萌”的讀英文小伙又是怎么被加進去的呢?洪小文說,開始的時候他們就想讓“英庫”用在寫作上,后來發(fā)現(xiàn)很多人用它發(fā)音學英文,所以負責語音的研究主管和負責自然語言的研究主管在咖啡間一碰面,就決定把“語音合成”的技術成果加進去。機器把每個單詞都讀出來不難,難的是如何抑揚頓挫把整句讀出來。通過研究院對自然語言的理解,“英庫”加進了讀句子的功能。后來他們又說,能不能讓人也能夠看視頻學口型啊,于是又加入了電腦合成的視頻。

  在視頻中出現(xiàn)的小伙并不是演員,而是“英庫”的開發(fā)者之一,美國小伙馬特·斯考特(Matt Scott)。他在一個實驗室里照一篇文章讀了30分鐘,研究人員把他的口型和聲音都錄下來了。通過實時的二維視頻合成技術,技術人員可以讓斯考特的影像講任何話,方法就是把語音對應的一個一個口型,加上中間的過渡口型實時調出來,合成一段平滑的活動影像。這樣,微軟研究院的電腦影像技術也派上了用場。正如洪小文所說,“以情境驅動的研究是不同領域合作的最好催化劑”。

  新知專題采寫/本報記者 劉錚

  本專題感謝:洪小文(微軟亞洲研究院院長)

  ■ 目擊

  微軟曬出的新發(fā)明

  在近期舉辦的2010年度微軟創(chuàng)新日活動中,記者看到了很多新鮮的發(fā)明。

  手機之類的移動終端越來越多的連接到互聯(lián)網,耗電就是一個大問題,微軟印度研究院研發(fā)的“云計劃支持的節(jié)能高效移動通信”就是為解決這個問題開發(fā)的技術,F(xiàn)在,手機從互聯(lián)網上下載數(shù)據的時候,無論網絡是否通暢,都要耗費一樣多的電能。“云計劃支持的節(jié)能高效移動通信”會讓互聯(lián)網的數(shù)據先傳送到一個云計算中心,云計算中心一方面對傳輸?shù)臄?shù)據進行壓縮優(yōu)化,另一方面會根據網絡的通暢程度來確定手機的用電量,以達到省電的目的。

  微軟雷蒙德研究院和

中國科學院國家天文臺合作的“萬維天文望遠鏡”項目是研究院和高校合作的典型例子。在這個軟件界面出現(xiàn)之前,美國航天局和世界各地的天文臺都創(chuàng)造和收集了大量的宇宙圖像,但這些數(shù)據分布在各處,彼此很難分享。“萬維天文望遠鏡”就是為了解決這個問題而研制的。無論你放大軟件界面上的任何天空區(qū)域,都能調出關于這個區(qū)域的大量圖像,用戶會有一種“實時在宇宙中漫游”的感覺。

  除了“必應詞典”,必應還可能整合其他一些微軟研究院的研究成果,其中最有趣的是“基于輪廓的圖像搜索引擎”。比如說,在草圖板上畫一個圓,可以搜出月亮、太陽、地球等圖像;而畫兩個圓,可以搜出兩個并排的壽司和自行車;如果在兩個輪之間簡要地畫上一個三角形的梁,搜出來的圖像大多數(shù)都是自行車。

  最神奇有趣的發(fā)明還要數(shù)微軟和日本東京大學聯(lián)合研制的“電子輔助眼”。這其實是一種裝有電子傳感器的眼鏡,它可以和電腦相連,感知使用者的目光聚焦在何處。比如當使用者看一只貓時,系統(tǒng)就會知道他在看哪里,并且通過圖像識別軟件,系統(tǒng)可以分析出來他在看一只貓。未來通過這種電子輔助眼,雙手殘疾的人可以通過看字母表來打字,而普通人在逛超市的時候,看到哪個商品,系統(tǒng)就會顯示出這個商品的參數(shù),以及同類商品的價格。