?Siri是蘋果公司在其產(chǎn)品iphone4S上應(yīng)用的一項(xiàng)語音控制功能?!緹o彈窗.】Siri可以令iPhone4S變身為一臺(tái)智能化機(jī)器人,利用Siri用戶可以通過手機(jī)讀短信、介紹餐廳、詢問天氣、可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、rì程安排、搜索資料等應(yīng)用。還能夠不斷學(xué)習(xí)新的聲音和語調(diào),讀音siri,讀音為/siri./,更為體現(xiàn)其功能,漢語化,可以將其讀為“say瑞”,寓意“說出吉祥與福瑞”。技術(shù)來源Siri技術(shù)來源于美國(guó)國(guó)防部高級(jí)研究規(guī)劃局所公布的CALO計(jì)劃:一個(gè)讓軍方簡(jiǎn)化處理一些繁復(fù)庶務(wù),并具學(xué)習(xí)、組織以及認(rèn)知能力的數(shù)字助理,其所衍生出來的民用版軟件Siri虛擬個(gè)人助理。功能
Siri能做的,聽起來相當(dāng)不一般,使用者可透過聲控、文字輸入的方式,來搜尋餐廳、電影院等生活信息,同時(shí)也可以直接收看各項(xiàng)相關(guān)評(píng)論,甚至是直接訂位、訂票;另外其適地xìng(locationbased)服務(wù)的能力也相當(dāng)強(qiáng)悍,能夠依據(jù)用戶默認(rèn)的居家地址或是所在位置來判斷、過濾搜尋的結(jié)果。
Siri功能升級(jí)(4張)
不過其最大的特sè,則是人機(jī)的互動(dòng)方面,不僅有十分生動(dòng)的對(duì)話接口,其針對(duì)用戶詢問所給予的回答,也不至于答非所問,有時(shí)候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的內(nèi)容包括了『drunk』、『home』這些字(甚至不需要符合語法,相當(dāng)人xìng化...),Siri則會(huì)判斷為喝醉酒
、要回家,并自動(dòng)建議是否要幫忙叫出租車。
不過唯一可惜的是,該軟件目前僅支持英語,另外相關(guān)信息也僅限于美國(guó)本土,但整個(gè)軟件的概念,可以說是相當(dāng)?shù)挠腥ぃ疫€是免費(fèi)的。[1]
相關(guān)支持:Siri語音系統(tǒng)目前支持英語、法語和德語,不過由于其仍處于測(cè)試階段,對(duì)中文的支持可能并不甚理想,未來會(huì)加入更多語言支持。
Siri技術(shù)和語音控制的區(qū)別
說到語音控制識(shí)別技術(shù),就不得不提Android系統(tǒng)的VoiceAs,這也是一項(xiàng)偉大的語音控制技術(shù),并已經(jīng)被許多Android用戶所熟知和使用。但是它和Siri完全不是一個(gè)級(jí)別的產(chǎn)品。
VoiceAs提供了非常堅(jiān)實(shí)可靠的聲音識(shí)別引擎,它的高識(shí)別度令人稱奇。不過,和過去的所有語音命令系統(tǒng)一樣,它要求你說的話要具備嚴(yán)格的語法結(jié)構(gòu)和格式,否則系統(tǒng)將無法識(shí)別。
然而Siri和VoiceAs就有本質(zhì)的不同了。你可以拋棄繁瑣的語法結(jié)構(gòu),甚至思維模式也可以混亂,Siri會(huì)結(jié)合上下文結(jié)構(gòu)去理解,它還會(huì)從人類語言史的角度出發(fā),利用人工智能系統(tǒng)去分析,并在絕大多數(shù)情況下領(lǐng)會(huì)你的意思。
而更加人xìng化的特點(diǎn)是,一旦你開始和Siri進(jìn)入一段對(duì)話,它甚至能理解許多含義模糊或者引申的語義。而VoiceAs做不到這樣的事情,因?yàn)樗皇且粋€(gè)聲控命令軟件,而并非人工智能。
語音識(shí)別不是革命xìng的。多年前,IBM的語音識(shí)別軟件在PC上就有不錯(cuò)的識(shí)別率了。
基于語音識(shí)別,簡(jiǎn)單的智能分析和系統(tǒng)功能的調(diào)用也不算革命xìng的。無論是Google的VoiceA,還是Vlingo等dúlì的公司,做的都不錯(cuò)。
但是,從目前流出的視頻看,Siri并非這些已知技術(shù)的簡(jiǎn)單組合。
Siri的智能程度更高
Vlingo中你說
“TextMike,MessagesHoareyou.”
。xt是命令,Messages是關(guān)鍵字。匹配上這兩個(gè)詞,就知道給誰,發(fā)送什么內(nèi)容了。
而Siri理解上下文。你問了běijīng的天氣,再說:“HoaboutShanghai?”
,他知道你指的是天氣。
一個(gè)更驚人的例子出現(xiàn)在Siri被蘋果并購(gòu)前的演示里。你說“IlikearomanticplaceforItalianfoodnearmyoffice”。
Siri回答:”IamlookingforaItaliaaurantshichreviessayare
romantiearyourokinSanJose…“
這個(gè)回答說明Siri聽懂了romantic是個(gè)形容詞。并且知道nearmyoffice是個(gè)地方。并且,找到了以前存儲(chǔ)的用戶的工作地點(diǎn)。并且,他知道怎么判斷一個(gè)餐館是否romantic?。ㄈニ阉鱮evies)
把同樣的話對(duì)著Android的VoiceA或者Vlingo說一遍,你就知道Siri具有超越現(xiàn)有Apps的智能。
Siri和系統(tǒng)的整合更加緊密
Siri在并購(gòu)前的版本整合了大量網(wǎng)絡(luò)服務(wù)的APIs。比如OpenTable,Tickets,TaxiMagic等等。
而Siri被蘋果收購(gòu)了之后,
他已經(jīng)被整合為系統(tǒng)的一部分了。
在iOS5的Siri視頻中,出現(xiàn)新短消息之后,交互由Siri發(fā)起。說明他已經(jīng)常駐系統(tǒng)后臺(tái)并且可以接管重要的系統(tǒng)功能了。(除了短消息還有天氣,時(shí)鐘,Maps等等)[2]
Siri支持的語言
Siri目前支持三種語言:英文,法文,德文。其中英文分美式,英式,澳大利亞式。相關(guān)技術(shù)
Siri所用到的技術(shù),很多人會(huì)回答,人工智能以及云計(jì)算,的確,總體來說,是這兩樣技術(shù),不過,這種概述感覺幾乎沒有任何意義,何不直接說“計(jì)算技術(shù)”(注意,不是計(jì)算機(jī)技術(shù))呢。因此,在本文,我將介紹下我了解Siri可能采用的技術(shù)(由于有個(gè)人猜測(cè),不一定準(zhǔn)確)。
首先,在前端方面,即面向用戶,和用戶交互(UserInterface,UI)的技術(shù),主要是語音識(shí)別以及語音合成技術(shù)。語音識(shí)別技術(shù)是把用戶的口語轉(zhuǎn)化成文字,其中需要強(qiáng)大的語音知識(shí)庫(kù),因此需要用到所謂的“云計(jì)算”技術(shù)。而語音合成則是把返回的文字結(jié)果轉(zhuǎn)化成語音輸出,這個(gè)技術(shù)理論上本地就能完成,但不知道Siri是否如此,當(dāng)然,在云端完成也并無不可,在當(dāng)前無線帶寬下,那點(diǎn)語音流量根本不算什么。[3]
其次,后臺(tái)技術(shù),這些其實(shí)才是真正的大角sè。這些技術(shù)的目的就是處理用戶的請(qǐng)求,并返回最匹配的結(jié)果,這些請(qǐng)求類型很多,千奇百怪,要處理好并不簡(jiǎn)單?;镜慕Y(jié)構(gòu)猜測(cè)可能是分析用戶的輸入(已經(jīng)通過語音轉(zhuǎn)化),根據(jù)輸入類型,分別采用合適的技術(shù)(合適的技術(shù)后臺(tái))進(jìn)行處理。這些合適的后臺(tái)技術(shù)包括,①以Google為代表的網(wǎng)頁(yè)搜索技術(shù);②以olframAlpha為代表的知識(shí)搜索技術(shù)(或者知識(shí)計(jì)算技術(shù));③以ikipedia為代表的知識(shí)庫(kù)(和olframAlpha不同的是,這些知識(shí)來自人類的手工編輯)技術(shù)(包括其他百科,如電影百科等);④以Yelp為代表的問答以及推薦技術(shù)。
網(wǎng)頁(yè)搜索技術(shù)[3]
這個(gè)我想沒必要介紹,大家天天用的Google就是這個(gè)技術(shù)的代表。而國(guó)內(nèi)的話,則以百度為代表。
知識(shí)計(jì)算(搜索)技術(shù)(putational
Knoledge)[3]
這個(gè)技術(shù)的代表是olfram|Alpha。
不同于搜索互聯(lián)網(wǎng)信息,olfram|Alpha將從公眾的(包括公開的網(wǎng)頁(yè)等)和獲得授權(quán)的資源中,發(fā)掘、建立起一個(gè)異常龐大的經(jīng)過組織的數(shù)據(jù)庫(kù),再利用高級(jí)的自然語言算法進(jìn)行處理,最終構(gòu)造出一個(gè)類似于谷歌搜索的工具。
和網(wǎng)頁(yè)搜索技術(shù)不同的是,在這個(gè)系統(tǒng)中,得到的答案結(jié)構(gòu)化程度很高,比如搜索a,能得到和中國(guó)相關(guān)的各種參數(shù)以及資料,fram|Alpha也能理解部分自然語言,比如輸出Hooldareyou,其會(huì)回答olfram|Alpha的年齡。想測(cè)試這項(xiàng)技術(shù)的請(qǐng)移步olfram|Alpha。
這個(gè)技術(shù)國(guó)內(nèi)做的應(yīng)該有,但還沒有產(chǎn)品,也許百度的框計(jì)算算是半個(gè)。所以機(jī)會(huì)大大的有。
知識(shí)庫(kù)技術(shù)[3]
這名字是我自己起的,不知道有沒有貽笑大方……這個(gè)技術(shù)的代表是維基百科,以及各種專門的百科網(wǎng)站。相比于網(wǎng)頁(yè)搜索技術(shù),基本以一個(gè)詞條或者主題為單位,因此得到的數(shù)據(jù)價(jià)值高,知識(shí)量大,并且結(jié)構(gòu)化程度好。相比于知識(shí)計(jì)算技術(shù),這些技術(shù)需要人的參與,這有利也有弊,利就是,畢竟暫時(shí)人比機(jī)器聰明,編輯出來的知識(shí)更豐富,準(zhǔn)確;弊就是,人力有限,即使像維基那樣,發(fā)動(dòng)社區(qū)的力量,也不能產(chǎn)生足夠的知識(shí),而知識(shí)計(jì)算,理論上,只需要算法夠牛叉,是可以產(chǎn)生“無限”的知識(shí)的。
另外,寫到這里,我想起Yahoo和Google的故事,當(dāng)年,Yahoo是搜索老大,就像現(xiàn)在的ekipedia在知識(shí)搜索領(lǐng)域一樣,而Google是小弟,就像olfram|Alpha在知識(shí)搜索領(lǐng)域一樣。但后來,卻反過來了,Googe成了網(wǎng)頁(yè)搜索老大,Yahoo成了小弟,原因就是Google相信算法的結(jié)果,把所有事都交給算法做,而Yahoo,很多索引都是人工編輯的。我想,也許有一天,ekipedia和olfram|Alpha也會(huì)出現(xiàn)這樣的情況。
問答推薦技術(shù)
其實(shí)這不能稱為一個(gè)技術(shù),應(yīng)該屬于知識(shí)庫(kù)的技術(shù)。不同的是,這個(gè)技術(shù)針對(duì)的是一些生活信息,這些信息的地域化程度很高,典型代表為Yelp。由于這東西比較簡(jiǎn)單,就不仔細(xì)介紹了。
其實(shí)在國(guó)內(nèi),這方面的網(wǎng)站也有,那就是大眾點(diǎn)評(píng)網(wǎng)這些。相關(guān)信息
在iphone4S的蘋果發(fā)布會(huì)中蘋果稱SiriVoice原Siri應(yīng)用界面(現(xiàn)已下架)[4]Assistant
原是一個(gè)第三方應(yīng)用,是蘋果在去年花費(fèi)2億美元購(gòu)買所得的。雖然在收購(gòu)后很長(zhǎng)的一段時(shí)間里我們?nèi)阅茉贏ppStore上看到這一應(yīng)用的身影,不過它將近有一年多的時(shí)間沒有更新。而直到今天蘋果在發(fā)布會(huì)上介紹Siri這一功能后,Siri這一應(yīng)用才正式下架。
大家可能沒有注意到的是,Siri下架是jīng心安排的:Siri在蘋果大會(huì)上第一次被提及的時(shí)候,這一應(yīng)用還能在AppStore上輕松的找到。但在大會(huì)結(jié)束后,這一應(yīng)用就再也找不著了??雌饋鞸iri這一應(yīng)用是在大會(huì)結(jié)束的同時(shí)下架的。
為什么要下架呢?這是可能是因?yàn)樘O果擔(dān)心第三方應(yīng)用若能夠?qū)崿F(xiàn)iPhone4S的功能的話,會(huì)影響現(xiàn)有的iPhone用戶購(gòu)買新iPhone的yù望,從而影響銷量。
[5]běijīng時(shí)間2011年10月15rì消息,據(jù)國(guó)外媒體報(bào)道,蘋果官網(wǎng)Siri常見問題(FAQ)頁(yè)面稱,蘋果語音識(shí)別個(gè)人助理功能Siri將在明年支持中文、rì文、韓文、意大利文和西班牙文等更多語言。
目前Siri支持英文、法文和德文的語音識(shí)別,其中英文部分只支持美國(guó)、英國(guó)和澳大利亞的口音,對(duì)于其他國(guó)家和地區(qū)的英語口音在識(shí)別上還存在困難。
此外,被蘋果定義為仍處在“測(cè)試階段”的Siri目前支持在美國(guó)進(jìn)行地圖和本地搜索,不過蘋果官網(wǎng)的SiriFAQ頁(yè)面也承諾,十大功用
變身鬧鐘
這應(yīng)該是用戶最容易想到的Siri的“正經(jīng)”用法了。按住“Home”鍵,告訴Siri,“早上7點(diǎn)15的時(shí)候叫醒我”;想打會(huì)兒小盹,就說“40分鐘后叫醒我”。只要準(zhǔn)確地報(bào)上時(shí)間,Siri將是最好用的鬧鐘。
2.用Siri尋找咖啡廳
喝咖啡是很多上班族的習(xí)慣,一杯咖啡能夠迅速地將人調(diào)整成工作狀態(tài)。出門在外的時(shí)候,想找個(gè)咖啡廳?利用Siri就可以搞定這一切。告訴Siri,尋找離當(dāng)前位置最近的咖啡廳即可。如果你沒有附加更多的要求,Siri將反饋給還算不錯(cuò)的答案,很可能是告訴你最近的星巴克在哪。如果星巴克還不能滿足你的要求,還是用更專業(yè)的應(yīng)用Yelp吧,它會(huì)給你更詳細(xì)的答案。
3.想去哪,Siri告訴你
查找出行路線的過程中往往要輸入不少文字。想省事的話,還是用Siri完成這一切吧。報(bào)上要去的地點(diǎn),Siri會(huì)調(diào)用Google地圖來尋找出行路線的方案。從測(cè)試過的這種用法的用戶的反饋上看,Siri目前還沒有出過什么差錯(cuò),就像GPS那樣好使。
4.用Siri播放隨機(jī)音樂
如果你厭倦了固定順序的音樂播放列表,可以試著用Siri播放隨機(jī)音樂。首先,你需要將喜歡的音樂導(dǎo)入到一個(gè)名為“最愛”的播放列表中。開始聽音樂的時(shí)候,告訴Siri”放皇后樂隊(duì)的歌曲”。緊接著,Siri就會(huì)在“最愛”列表中匹配皇后樂隊(duì)的歌曲并將其播放。這樣就實(shí)現(xiàn)了隨機(jī)播放音樂的功能。
5.發(fā)送短信,Siri代勞
還在邊走路邊發(fā)短信?行路不安全不說,發(fā)短信還費(fèi)勁,以后用Siri代勞吧。走路的時(shí)候,將iPhone放在耳邊,告訴Siri“用短信告訴她,我將晚點(diǎn)到家”。不用匆忙,告訴Siri你想表達(dá)的內(nèi)容,即可輕輕松松地發(fā)送短信。
6.天氣預(yù)報(bào),Siri知道
這也是Siri十分擅長(zhǎng)的一項(xiàng)功能。關(guān)于氣象信息的問題,Siri都能正確理解。想要知道明天的天氣怎樣,問問Siri就知道了。
7.用Siri提醒rì程安排
既然能把Siri當(dāng)鬧鐘用,你當(dāng)然可以用它來提醒rì程安排。很多人都有使用Googlerì歷的習(xí)慣,用Googlerì歷安排自己的各項(xiàng)rì程。生活中的一些需要提醒的小事,完全沒有必要一項(xiàng)項(xiàng)地加到Googlerì歷中去,用Siri就可以搞定這個(gè)問題。比如說,“十點(diǎn)鐘的時(shí)候,提醒我去刷牙”。
8.用Siri提醒地點(diǎn)
Siri提醒地點(diǎn)的功能目前還不是很完善。除了“家”或“上班處”,Siri對(duì)于一些位置稱呼的理解能力不佳。但是,Siri對(duì)“這里”的理解十分準(zhǔn)確,即當(dāng)前的GPS坐標(biāo)位置。所以你可以這樣用Siri的提醒功能,途徑一家不錯(cuò)的小店時(shí),可以將它的位置標(biāo)記為“這里”并設(shè)置好提醒,以便rì后有時(shí)間時(shí)再次光顧。
為你答疑解惑
珠穆朗瑪峰現(xiàn)在多高?美國(guó)去年的GDP是多少?回答不上來的話,無需Google,本身是不知道這些問題的答案的,它會(huì)從“知識(shí)問答引擎”olframAlpha中尋找答案。所有的回答都會(huì)以自然語言的形式呈現(xiàn)。這也是Siri被認(rèn)為將對(duì)Google重要威脅的原因。當(dāng)然,Siri在相當(dāng)長(zhǎng)的一段時(shí)間肯定不能取代Google,但對(duì)Google的威脅將是長(zhǎng)遠(yuǎn)的。當(dāng)Siri足夠智能的時(shí)候,人們用它取代Google并不是沒有可能。
10.用Siri發(fā)推
如果你是Titter重度用戶,怎么能錯(cuò)過這個(gè)用法呢?不過在使用Siri發(fā)推前,還得做一些必要的設(shè)置。
Siri是蘋果公司在其產(chǎn)品iphone4S上應(yīng)用的一項(xiàng)語音控制功能?!緹o彈窗.】Siri可以令iPhone4S變身為一臺(tái)智能化機(jī)器人,利用Siri用戶可以通過手機(jī)讀短信、介紹餐廳、詢問天氣、可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、rì程安排、搜索資料等應(yīng)用。還能夠不斷學(xué)習(xí)新的聲音和語調(diào),讀音siri,讀音為/siri./,更為體現(xiàn)其功能,漢語化,可以將其讀為“say瑞”,寓意“說出吉祥與福瑞”。技術(shù)來源Siri技術(shù)來源于美國(guó)國(guó)防部高級(jí)研究規(guī)劃局所公布的CALO計(jì)劃:一個(gè)讓軍方簡(jiǎn)化處理一些繁復(fù)庶務(wù),并具學(xué)習(xí)、組織以及認(rèn)知能力的數(shù)字助理,其所衍生出來的民用版軟件Siri虛擬個(gè)人助理。功能
Siri能做的,聽起來相當(dāng)不一般,使用者可透過聲控、文字輸入的方式,來搜尋餐廳、電影院等生活信息,同時(shí)也可以直接收看各項(xiàng)相關(guān)評(píng)論,甚至是直接訂位、訂票;另外其適地xìng(locationbased)服務(wù)的能力也相當(dāng)強(qiáng)悍,能夠依據(jù)用戶默認(rèn)的居家地址或是所在位置來判斷、過濾搜尋的結(jié)果。
Siri功能升級(jí)(4張)
不過其最大的特sè,則是人機(jī)的互動(dòng)方面,不僅有十分生動(dòng)的對(duì)話接口,其針對(duì)用戶詢問所給予的回答,也不至于答非所問,有時(shí)候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的內(nèi)容包括了『drunk』、『home』這些字(甚至不需要符合語法,相當(dāng)人xìng化...),Siri則會(huì)判斷為喝醉酒
、要回家,并自動(dòng)建議是否要幫忙叫出租車。
不過唯一可惜的是,該軟件目前僅支持英語,另外相關(guān)信息也僅限于美國(guó)本土,但整個(gè)軟件的概念,可以說是相當(dāng)?shù)挠腥?,而且還是免費(fèi)的。[1]
相關(guān)支持:Siri語音系統(tǒng)目前支持英語、法語和德語,不過由于其仍處于測(cè)試階段,對(duì)中文的支持可能并不甚理想,未來會(huì)加入更多語言支持。
Siri技術(shù)和語音控制的區(qū)別
說到語音控制識(shí)別技術(shù),就不得不提Android系統(tǒng)的VoiceAs,這也是一項(xiàng)偉大的語音控制技術(shù),并已經(jīng)被許多Android用戶所熟知和使用。但是它和Siri完全不是一個(gè)級(jí)別的產(chǎn)品。
VoiceAs提供了非常堅(jiān)實(shí)可靠的聲音識(shí)別引擎,它的高識(shí)別度令人稱奇。不過,和過去的所有語音命令系統(tǒng)一樣,它要求你說的話要具備嚴(yán)格的語法結(jié)構(gòu)和格式,否則系統(tǒng)將無法識(shí)別。
然而Siri和VoiceAs就有本質(zhì)的不同了。你可以拋棄繁瑣的語法結(jié)構(gòu),甚至思維模式也可以混亂,Siri會(huì)結(jié)合上下文結(jié)構(gòu)去理解,它還會(huì)從人類語言史的角度出發(fā),利用人工智能系統(tǒng)去分析,并在絕大多數(shù)情況下領(lǐng)會(huì)你的意思。
而更加人xìng化的特點(diǎn)是,一旦你開始和Siri進(jìn)入一段對(duì)話,它甚至能理解許多含義模糊或者引申的語義。而VoiceAs做不到這樣的事情,因?yàn)樗皇且粋€(gè)聲控命令軟件,而并非人工智能。
語音識(shí)別不是革命xìng的。多年前,IBM的語音識(shí)別軟件在PC上就有不錯(cuò)的識(shí)別率了。
基于語音識(shí)別,簡(jiǎn)單的智能分析和系統(tǒng)功能的調(diào)用也不算革命xìng的。無論是Google的VoiceA,還是Vlingo等dúlì的公司,做的都不錯(cuò)。
但是,從目前流出的視頻看,Siri并非這些已知技術(shù)的簡(jiǎn)單組合。
Siri的智能程度更高
Vlingo中你說
“TextMike,MessagesHoareyou.”
。xt是命令,Messages是關(guān)鍵字。匹配上這兩個(gè)詞,就知道給誰,發(fā)送什么內(nèi)容了。
而Siri理解上下文。你問了běijīng的天氣,再說:“HoaboutShanghai?”
,他知道你指的是天氣。
一個(gè)更驚人的例子出現(xiàn)在Siri被蘋果并購(gòu)前的演示里。你說“IlikearomanticplaceforItalianfoodnearmyoffice”。
Siri回答:”IamlookingforaItaliaaurantshichreviessayare
romantiearyourokinSanJose…“
這個(gè)回答說明Siri聽懂了romantic是個(gè)形容詞。并且知道nearmyoffice是個(gè)地方。并且,找到了以前存儲(chǔ)的用戶的工作地點(diǎn)。并且,他知道怎么判斷一個(gè)餐館是否romantic?。ㄈニ阉鱮evies)
把同樣的話對(duì)著Android的VoiceA或者Vlingo說一遍,你就知道Siri具有超越現(xiàn)有Apps的智能。
Siri和系統(tǒng)的整合更加緊密
Siri在并購(gòu)前的版本整合了大量網(wǎng)絡(luò)服務(wù)的APIs。比如OpenTable,Tickets,TaxiMagic等等。
而Siri被蘋果收購(gòu)了之后,
他已經(jīng)被整合為系統(tǒng)的一部分了。
在iOS5的Siri視頻中,出現(xiàn)新短消息之后,交互由Siri發(fā)起。說明他已經(jīng)常駐系統(tǒng)后臺(tái)并且可以接管重要的系統(tǒng)功能了。(除了短消息還有天氣,時(shí)鐘,Maps等等)[2]
Siri支持的語言
Siri目前支持三種語言:英文,法文,德文。其中英文分美式,英式,澳大利亞式。相關(guān)技術(shù)
Siri所用到的技術(shù),很多人會(huì)回答,人工智能以及云計(jì)算,的確,總體來說,是這兩樣技術(shù),不過,這種概述感覺幾乎沒有任何意義,何不直接說“計(jì)算技術(shù)”(注意,不是計(jì)算機(jī)技術(shù))呢。因此,在本文,我將介紹下我了解Siri可能采用的技術(shù)(由于有個(gè)人猜測(cè),不一定準(zhǔn)確)。
首先,在前端方面,即面向用戶,和用戶交互(UserInterface,UI)的技術(shù),主要是語音識(shí)別以及語音合成技術(shù)。語音識(shí)別技術(shù)是把用戶的口語轉(zhuǎn)化成文字,其中需要強(qiáng)大的語音知識(shí)庫(kù),因此需要用到所謂的“云計(jì)算”技術(shù)。而語音合成則是把返回的文字結(jié)果轉(zhuǎn)化成語音輸出,這個(gè)技術(shù)理論上本地就能完成,但不知道Siri是否如此,當(dāng)然,在云端完成也并無不可,在當(dāng)前無線帶寬下,那點(diǎn)語音流量根本不算什么。[3]
其次,后臺(tái)技術(shù),這些其實(shí)才是真正的大角sè。這些技術(shù)的目的就是處理用戶的請(qǐng)求,并返回最匹配的結(jié)果,這些請(qǐng)求類型很多,千奇百怪,要處理好并不簡(jiǎn)單?;镜慕Y(jié)構(gòu)猜測(cè)可能是分析用戶的輸入(已經(jīng)通過語音轉(zhuǎn)化),根據(jù)輸入類型,分別采用合適的技術(shù)(合適的技術(shù)后臺(tái))進(jìn)行處理。這些合適的后臺(tái)技術(shù)包括,①以Google為代表的網(wǎng)頁(yè)搜索技術(shù);②以olframAlpha為代表的知識(shí)搜索技術(shù)(或者知識(shí)計(jì)算技術(shù));③以ikipedia為代表的知識(shí)庫(kù)(和olframAlpha不同的是,這些知識(shí)來自人類的手工編輯)技術(shù)(包括其他百科,如電影百科等);④以Yelp為代表的問答以及推薦技術(shù)。
網(wǎng)頁(yè)搜索技術(shù)[3]
這個(gè)我想沒必要介紹,大家天天用的Google就是這個(gè)技術(shù)的代表。而國(guó)內(nèi)的話,則以百度為代表。
知識(shí)計(jì)算(搜索)技術(shù)(putational
Knoledge)[3]
這個(gè)技術(shù)的代表是olfram|Alpha。
不同于搜索互聯(lián)網(wǎng)信息,olfram|Alpha將從公眾的(包括公開的網(wǎng)頁(yè)等)和獲得授權(quán)的資源中,發(fā)掘、建立起一個(gè)異常龐大的經(jīng)過組織的數(shù)據(jù)庫(kù),再利用高級(jí)的自然語言算法進(jìn)行處理,最終構(gòu)造出一個(gè)類似于谷歌搜索的工具。
和網(wǎng)頁(yè)搜索技術(shù)不同的是,在這個(gè)系統(tǒng)中,得到的答案結(jié)構(gòu)化程度很高,比如搜索a,能得到和中國(guó)相關(guān)的各種參數(shù)以及資料,fram|Alpha也能理解部分自然語言,比如輸出Hooldareyou,其會(huì)回答olfram|Alpha的年齡。想測(cè)試這項(xiàng)技術(shù)的請(qǐng)移步olfram|Alpha。
這個(gè)技術(shù)國(guó)內(nèi)做的應(yīng)該有,但還沒有產(chǎn)品,也許百度的框計(jì)算算是半個(gè)。所以機(jī)會(huì)大大的有。
知識(shí)庫(kù)技術(shù)[3]
這名字是我自己起的,不知道有沒有貽笑大方……這個(gè)技術(shù)的代表是維基百科,以及各種專門的百科網(wǎng)站。相比于網(wǎng)頁(yè)搜索技術(shù),基本以一個(gè)詞條或者主題為單位,因此得到的數(shù)據(jù)價(jià)值高,知識(shí)量大,并且結(jié)構(gòu)化程度好。相比于知識(shí)計(jì)算技術(shù),這些技術(shù)需要人的參與,這有利也有弊,利就是,畢竟暫時(shí)人比機(jī)器聰明,編輯出來的知識(shí)更豐富,準(zhǔn)確;弊就是,人力有限,即使像維基那樣,發(fā)動(dòng)社區(qū)的力量,也不能產(chǎn)生足夠的知識(shí),而知識(shí)計(jì)算,理論上,只需要算法夠牛叉,是可以產(chǎn)生“無限”的知識(shí)的。
另外,寫到這里,我想起Yahoo和Google的故事,當(dāng)年,Yahoo是搜索老大,就像現(xiàn)在的ekipedia在知識(shí)搜索領(lǐng)域一樣,而Google是小弟,就像olfram|Alpha在知識(shí)搜索領(lǐng)域一樣。但后來,卻反過來了,Googe成了網(wǎng)頁(yè)搜索老大,Yahoo成了小弟,原因就是Google相信算法的結(jié)果,把所有事都交給算法做,而Yahoo,很多索引都是人工編輯的。我想,也許有一天,ekipedia和olfram|Alpha也會(huì)出現(xiàn)這樣的情況。
問答推薦技術(shù)
其實(shí)這不能稱為一個(gè)技術(shù),應(yīng)該屬于知識(shí)庫(kù)的技術(shù)。不同的是,這個(gè)技術(shù)針對(duì)的是一些生活信息,這些信息的地域化程度很高,典型代表為Yelp。由于這東西比較簡(jiǎn)單,就不仔細(xì)介紹了。
其實(shí)在國(guó)內(nèi),這方面的網(wǎng)站也有,那就是大眾點(diǎn)評(píng)網(wǎng)這些。相關(guān)信息
在iphone4S的蘋果發(fā)布會(huì)中蘋果稱SiriVoice原Siri應(yīng)用界面(現(xiàn)已下架)[4]Assistant
原是一個(gè)第三方應(yīng)用,是蘋果在去年花費(fèi)2億美元購(gòu)買所得的。雖然在收購(gòu)后很長(zhǎng)的一段時(shí)間里我們?nèi)阅茉贏ppStore上看到這一應(yīng)用的身影,不過它將近有一年多的時(shí)間沒有更新。而直到今天蘋果在發(fā)布會(huì)上介紹Siri這一功能后,Siri這一應(yīng)用才正式下架。
大家可能沒有注意到的是,Siri下架是jīng心安排的:Siri在蘋果大會(huì)上第一次被提及的時(shí)候,這一應(yīng)用還能在AppStore上輕松的找到。但在大會(huì)結(jié)束后,這一應(yīng)用就再也找不著了。看起來Siri這一應(yīng)用是在大會(huì)結(jié)束的同時(shí)下架的。
為什么要下架呢?這是可能是因?yàn)樘O果擔(dān)心第三方應(yīng)用若能夠?qū)崿F(xiàn)iPhone4S的功能的話,會(huì)影響現(xiàn)有的iPhone用戶購(gòu)買新iPhone的yù望,從而影響銷量。
[5]běijīng時(shí)間2011年10月15rì消息,據(jù)國(guó)外媒體報(bào)道,蘋果官網(wǎng)Siri常見問題(FAQ)頁(yè)面稱,蘋果語音識(shí)別個(gè)人助理功能Siri將在明年支持中文、rì文、韓文、意大利文和西班牙文等更多語言。
目前Siri支持英文、法文和德文的語音識(shí)別,其中英文部分只支持美國(guó)、英國(guó)和澳大利亞的口音,對(duì)于其他國(guó)家和地區(qū)的英語口音在識(shí)別上還存在困難。
此外,被蘋果定義為仍處在“測(cè)試階段”的Siri目前支持在美國(guó)進(jìn)行地圖和本地搜索,不過蘋果官網(wǎng)的SiriFAQ頁(yè)面也承諾,十大功用
變身鬧鐘
這應(yīng)該是用戶最容易想到的Siri的“正經(jīng)”用法了。按住“Home”鍵,告訴Siri,“早上7點(diǎn)15的時(shí)候叫醒我”;想打會(huì)兒小盹,就說“40分鐘后叫醒我”。只要準(zhǔn)確地報(bào)上時(shí)間,Siri將是最好用的鬧鐘。
2.用Siri尋找咖啡廳
喝咖啡是很多上班族的習(xí)慣,一杯咖啡能夠迅速地將人調(diào)整成工作狀態(tài)。出門在外的時(shí)候,想找個(gè)咖啡廳?利用Siri就可以搞定這一切。告訴Siri,尋找離當(dāng)前位置最近的咖啡廳即可。如果你沒有附加更多的要求,Siri將反饋給還算不錯(cuò)的答案,很可能是告訴你最近的星巴克在哪。如果星巴克還不能滿足你的要求,還是用更專業(yè)的應(yīng)用Yelp吧,它會(huì)給你更詳細(xì)的答案。
3.想去哪,Siri告訴你
查找出行路線的過程中往往要輸入不少文字。想省事的話,還是用Siri完成這一切吧。報(bào)上要去的地點(diǎn),Siri會(huì)調(diào)用Google地圖來尋找出行路線的方案。從測(cè)試過的這種用法的用戶的反饋上看,Siri目前還沒有出過什么差錯(cuò),就像GPS那樣好使。
4.用Siri播放隨機(jī)音樂
如果你厭倦了固定順序的音樂播放列表,可以試著用Siri播放隨機(jī)音樂。首先,你需要將喜歡的音樂導(dǎo)入到一個(gè)名為“最愛”的播放列表中。開始聽音樂的時(shí)候,告訴Siri”放皇后樂隊(duì)的歌曲”。緊接著,Siri就會(huì)在“最愛”列表中匹配皇后樂隊(duì)的歌曲并將其播放。這樣就實(shí)現(xiàn)了隨機(jī)播放音樂的功能。
5.發(fā)送短信,Siri代勞
還在邊走路邊發(fā)短信?行路不安全不說,發(fā)短信還費(fèi)勁,以后用Siri代勞吧。走路的時(shí)候,將iPhone放在耳邊,告訴Siri“用短信告訴她,我將晚點(diǎn)到家”。不用匆忙,告訴Siri你想表達(dá)的內(nèi)容,即可輕輕松松地發(fā)送短信。
6.天氣預(yù)報(bào),Siri知道
這也是Siri十分擅長(zhǎng)的一項(xiàng)功能。關(guān)于氣象信息的問題,Siri都能正確理解。想要知道明天的天氣怎樣,問問Siri就知道了。
7.用Siri提醒rì程安排
既然能把Siri當(dāng)鬧鐘用,你當(dāng)然可以用它來提醒rì程安排。很多人都有使用Googlerì歷的習(xí)慣,用Googlerì歷安排自己的各項(xiàng)rì程。生活中的一些需要提醒的小事,完全沒有必要一項(xiàng)項(xiàng)地加到Googlerì歷中去,用Siri就可以搞定這個(gè)問題。比如說,“十點(diǎn)鐘的時(shí)候,提醒我去刷牙”。
8.用Siri提醒地點(diǎn)
Siri提醒地點(diǎn)的功能目前還不是很完善。除了“家”或“上班處”,Siri對(duì)于一些位置稱呼的理解能力不佳。但是,Siri對(duì)“這里”的理解十分準(zhǔn)確,即當(dāng)前的GPS坐標(biāo)位置。所以你可以這樣用Siri的提醒功能,途徑一家不錯(cuò)的小店時(shí),可以將它的位置標(biāo)記為“這里”并設(shè)置好提醒,以便rì后有時(shí)間時(shí)再次光顧。
為你答疑解惑
珠穆朗瑪峰現(xiàn)在多高?美國(guó)去年的GDP是多少?回答不上來的話,無需Google,本身是不知道這些問題的答案的,它會(huì)從“知識(shí)問答引擎”olframAlpha中尋找答案。所有的回答都會(huì)以自然語言的形式呈現(xiàn)。這也是Siri被認(rèn)為將對(duì)Google重要威脅的原因。當(dāng)然,Siri在相當(dāng)長(zhǎng)的一段時(shí)間肯定不能取代Google,但對(duì)Google的威脅將是長(zhǎng)遠(yuǎn)的。當(dāng)Siri足夠智能的時(shí)候,人們用它取代Google并不是沒有可能。
10.用Siri發(fā)推
如果你是Titter重度用戶,怎么能錯(cuò)過這個(gè)用法呢?不過在使用Siri發(fā)推前,還得做一些必要的設(shè)置。