丰满人妻一区二区三区免费视频,狠狠综合久久久久尤物,免费无遮挡无码视频在线观看,少妇最高潮,久久精品人人做人人爽综合一

公司動態(tài) 投資企業(yè) 原創(chuàng)研究 媒體聚焦
【行業(yè)聚焦】深度好奇:讓機(jī)器善解人意
2019 10 28

注:近日,深度好奇聯(lián)合創(chuàng)始人兼CEO李祥生在天堂硅谷信息技術(shù)閉門會上做了精彩發(fā)言,以下根據(jù)其講話實(shí)錄整理而成。


【行業(yè)聚焦】深度好奇:讓機(jī)器善解人意


深度好奇有一個企業(yè)愿景和目標(biāo):“成為中國認(rèn)知智能領(lǐng)域的領(lǐng)軍力量”。這首先代表深度好奇必須做出真正的認(rèn)知智能硬核技術(shù),在國內(nèi)國際上達(dá)到一個水準(zhǔn)。我們的主要方向是自然語言處理(NLP),這是認(rèn)知智能的核心,包含不同技術(shù)領(lǐng)域。而在我們最擅長的部分,必須做到比巨頭更強(qiáng)。


在介紹深度好奇的技術(shù)和產(chǎn)品之前,首先,我想談幾個基本觀點(diǎn)。

第一個觀點(diǎn):人工智能的發(fā)展就像爬樓梯,左腳是感知,右腳是認(rèn)知,兩個腳要交替上升。

經(jīng)歷以視覺、生物識別為代表的感知智能前幾年的迅速發(fā)展普及之后,我們認(rèn)為,認(rèn)知智能,即將或正在成為人工智能發(fā)展新的重心。而且中長期市場容量可能比感知要大,會再上1-2個數(shù)量級。市場容量跟著要處理的數(shù)據(jù)量走。隨著5G到來、智能應(yīng)用深化,數(shù)據(jù)量劇增,其中很大一部分是非結(jié)構(gòu)化數(shù)據(jù),而文本和語言信息可能占了大頭。我們知道,不能結(jié)構(gòu)化的數(shù)據(jù),機(jī)器是沒法處理的。數(shù)據(jù)是礦,儲量迅速增大,但采礦能力嚴(yán)重不足。這就是我們今天做認(rèn)知智能、做自然語言處理的核心需求驅(qū)動。


第二個觀點(diǎn):認(rèn)知智能落地,要和行業(yè)邏輯做深度的結(jié)合。認(rèn)知關(guān)乎于主題、對象、知識和知識的關(guān)系,許多都帶有非常鮮明的行業(yè)和領(lǐng)域特征。所以深度有兩個含義。第一個含義是,從通用領(lǐng)域到細(xì)分行業(yè),從廣到深,涉及內(nèi)容指數(shù)級放大,容量/量級就上去了。第二個含義是,對行業(yè)深入其中,做認(rèn)知智能要吃透行業(yè)。要有深度好奇,深入其中,才會有深度認(rèn)知。


第三個觀點(diǎn):自然語言處理是認(rèn)知智能應(yīng)用必須要突破的瓶頸。“語言是認(rèn)知之母”,從知識表示、到大腦理性的思維活動、表達(dá)、溝通、推理、決策……,都是以語言為主要載體。而語言的難度、復(fù)雜度、多樣性,決定了所需要的技術(shù)高度、難度和復(fù)雜度。所以比爾蓋茨說“自然語言是人工智能皇冠上的明珠”。這是一個需要突破的地方,瓶頸突破,后面蘊(yùn)含的巨大價值才能夠被釋放出來,而掌握瓶頸技術(shù)的人,可能有優(yōu)先獲取權(quán)。

深度好奇就在做這件最難的事情。深度好奇的創(chuàng)始人、CTO呂正東博士在這方面的工作,具有國際一流的水準(zhǔn)。在過去五年的ACL(自然語言處理國際頂會No.1)排名前30的高引用論文中,有四篇來自大中華區(qū),其中有三篇來自正東和他帶的團(tuán)隊。所以,在自然語言處理的技術(shù)高度上,我們還是非常有自信可以站在國內(nèi)最強(qiáng)者之列。


通過這幾年積累,深度好奇發(fā)展出自己獨(dú)有的一套自然語言處理技術(shù)框架——面向?qū)ο蟮纳窠?jīng)規(guī)劃OONP(Objects-OrientedNeural Programming)。結(jié)合了人工智能中的符號主義(符號智能)和連接主義(神經(jīng)網(wǎng)絡(luò))。通俗一點(diǎn)說,符號智能力圖將一切都清晰地形式化、規(guī)則化;而聯(lián)結(jié)主義則更喜歡別想那么多、跟著感覺走。比如在什么情況下出門要帶雨傘?如果要把規(guī)則寫下來告訴計算機(jī),會發(fā)現(xiàn)要考慮非常多的因素:天氣、心情、為了防雨防曬防身還是偽裝、溫度、季節(jié)、氣候可能變化。。。這個規(guī)則很難窮舉。而跟著感覺走,并不代表隨機(jī)選擇,也是有道理的,只是道理沒有顯化,這就是神經(jīng)網(wǎng)絡(luò)(模糊邏輯)的方法。清晰和模糊、規(guī)則和感覺,二者結(jié)合,才更接近人腦,也是我們認(rèn)為處理語言的最佳方式。


這也是人工智能發(fā)展的下一代范式。而全球范圍里面目前深度好奇可能是唯一一家把這件事情做到落地的。在這個技術(shù)框架支撐下,我們得以突破在自然語言理解里面最難的一些部分,開始做到對語言“真正的理解”。我們現(xiàn)在可以實(shí)現(xiàn)復(fù)雜文本理解、篇章級文本理解、多輪對話、長距離的推理……這個實(shí)用價值是非常大的。

在落地場景和行業(yè)上,我們現(xiàn)在做了兩個行業(yè):公安、金融?,F(xiàn)有產(chǎn)品面向前后兩端。前端做交互,比如語音調(diào)度、多輪對話……,使得交互更加便捷。后端就是基于語義理解,去做非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化并延展到其他多模態(tài)數(shù)據(jù)。

今天時間有限,我主要介紹一下我們現(xiàn)在的兩個產(chǎn)品:

第一個是公安案情解析研判系統(tǒng)。就是對公安案件處理中涉及的各種文本,案情描述、筆錄、勘察報告之類,進(jìn)行語義解析,重構(gòu)知識和關(guān)系,用于理解案情、發(fā)現(xiàn)線索、分析串并、偵破推理。

我們的系統(tǒng)最近在上海青浦部署,剛剛上線沒多久,就從當(dāng)?shù)厣习倨鸬耐涤桶钢?,通過特征抓取識別出一個偷油團(tuán)伙。這上百個偷油案件,信息非常龐雜。我們產(chǎn)品部署上去之后,基于語義進(jìn)行各種比對和碰撞,就發(fā)現(xiàn):有四個人在一連串的案件中都在案發(fā)地附近出現(xiàn)。我們從案情文本構(gòu)建的知識圖譜中識別出嫌疑人、關(guān)聯(lián)人來,再和手機(jī)信息建立關(guān)聯(lián),再結(jié)合各種信息不斷發(fā)現(xiàn)特征模式,縮小嫌疑人范圍,從幾千、幾百到幾十,最后到4個人。。。我們還發(fā)現(xiàn)了其他一些關(guān)鍵信息,譬如同一輛外地牌照的車也都在好幾個地方出現(xiàn)。。。這些關(guān)鍵信息給到警察,后面的事情一下子就變得容易了。

這個真實(shí)案例所印證的技術(shù)原理,從刑偵到反恐、網(wǎng)安,包括輿情監(jiān)控,實(shí)際上都一樣。

第二個產(chǎn)品是我們叫信貸智能視頻審核系統(tǒng),就是利用人工智能機(jī)器人進(jìn)行線上的視頻審核。我們稱之為信貸風(fēng)險審核3.0。1.0就是線下的面審,2.0是大數(shù)據(jù)風(fēng)控。在面審這個環(huán)節(jié),之前由線下門店來做,人、信息、業(yè)務(wù)都是分散的,無法標(biāo)準(zhǔn)化、集中化,也存在道德風(fēng)險。我們現(xiàn)在打通線上線下,由機(jī)器人對信貸申請人,進(jìn)行身份核實(shí)和多輪的審核問答,最終形成一個綜合評估分?jǐn)?shù),融合到模型里面去做風(fēng)控,現(xiàn)在這個系統(tǒng)已經(jīng)在我們的合作伙伴那里全面上線。我們的多輪對話、語音語義聯(lián)合處理的技術(shù),和其他周邊AI技術(shù)結(jié)合(比如微表情、聲紋識別等),深度進(jìn)入行業(yè)之后,把我們合作伙伴的風(fēng)控KS指標(biāo),提升了5%-8%,這個在業(yè)界是非常不容易的。

最后,作為今天發(fā)言的一個結(jié)尾,我想說一句話:認(rèn)知智能是一條長程賽道,我們要讓自己長出翅膀來。

做NLP,尤其我們?nèi)プ稣Z義理解、復(fù)雜文本理解,難度很大,所以是一個長跑,靠深度、厚度和積累,去實(shí)現(xiàn)突破,并且持續(xù)地向上走,讓天花板和壁壘變得更高。盡管難,我們選擇這件事,也會持續(xù)不斷的去把這件事情越做越好。這是一個基于自身優(yōu)勢的主動選擇,也是一個立足于市場環(huán)境的競爭策略,因?yàn)楫?dāng)你做到最強(qiáng)的時候,就是一片藍(lán)海。當(dāng)然,在這一點(diǎn)上,我也要感謝我們合作伙伴和客戶的支持,特別是今天一起與會的中奧科技給我們的長期支持。

在NLP市場和技術(shù)伴隨發(fā)展的這條長程賽道上,我們要讓自己長出翅膀。風(fēng)來了豬都會飛,但風(fēng)一停,沒有翅膀的豬一定摔得很慘。所以要無懼風(fēng)起風(fēng)落,我們得有翅膀。這個翅膀,對于深度好奇來講就是:硬核技術(shù)+行業(yè)深度。這是我們自己的理解。

就講這么多,謝謝各位。

----------------------------------------

Q:我剛才看了你很多應(yīng)用在公安系統(tǒng)的。比如說有一個犯罪團(tuán)伙,是幾個地方的人構(gòu)成,北京人、中原往西部的人、華南人……比如說我說一句話,我說我先走就這個意思,北京說我先顛了(音),中原西部的人說我先撤了,廣東人會說我走先了,你們是如何把這種方言,不同的表述來達(dá)到一致,就說這些人他們先走了?

A:會通過一個學(xué)習(xí)的過程,方言也要學(xué)習(xí),學(xué)習(xí)之后就可以識別。我們的系統(tǒng)北方方言、南方方言(比如浙江臺州話)……,都可以支持。


Q:一般要訓(xùn)練多少次以后能達(dá)到這種真正比較精準(zhǔn)的認(rèn)知。因?yàn)橛行┑胤椒窖运鋵?shí)差別非常大?

A:這個從技術(shù)角度,一方面要看問題本身的復(fù)雜度,另一方面結(jié)合我們給機(jī)器提供的學(xué)習(xí)信息,信息越精準(zhǔn),學(xué)習(xí)速度就越快。為了精準(zhǔn)學(xué)習(xí),我們都是自己做標(biāo)注,人員學(xué)歷全都是本科以上。所以,從純粹訓(xùn)練次數(shù)上來講,這個仍然是一個綜合概念。就目前而言我們自己系統(tǒng)的一些核心功能,大概訓(xùn)練幾千到1萬次,就可以達(dá)到非常好的效果。這是深度學(xué)習(xí)的一個優(yōu)勢。


Q:剛剛王總提的其實(shí)是通用領(lǐng)域的認(rèn)知,李總解決的是垂直領(lǐng)域,是有邊界的。在沒有邊界的領(lǐng)域做智能,我們發(fā)現(xiàn)雖然大廠都在做,其實(shí)解決問題的效果沒有那么好,所以我們后來也在往垂直領(lǐng)域在看,看是不是說技術(shù)能夠在某些行業(yè)內(nèi)找到一些解決方案,問題又剛好是痛點(diǎn)。

A:是這樣的。我們知道聊天也好,對話也好或者理解也好,背后一定是依賴于一個知識集,如果是開放式的聊天機(jī)器人,想聊什么就聊什么,背后要求的知識其實(shí)很高的。所以我們在做方向選擇的時候,首先就把開放領(lǐng)域的聊天過掉了,因?yàn)槲覀兎浅G宄夹g(shù)應(yīng)用的邊界。


相關(guān)新聞