2020年2月4日,工信部發布《充分發揮人(rén)工智能賦能效用 協力抗擊新型冠狀病毒感染的(de)肺炎疫情倡議書》,要(yào / yāo)求加大(dà)科研攻關力度,盡快利用人(rén)工智能技術補齊疫情管控技術短闆,快速推動産業生産與應用服務,在(zài)疫情發現、預警、防治等方面有所作爲(wéi / wèi)。
這(zhè)是(shì)一(yī / yì /yí)場特殊的(de)戰争,而(ér)人(rén)工智能已成爲(wéi / wèi)一(yī / yì /yí)支特殊的(de)尖兵隊伍,不(bù)怕危險,不(bù)知疲倦,正全面加入抗擊新冠肺炎的(de)第一(yī / yì /yí)線。2月18日上(shàng)午,廈門創投視頻會議連線到(dào)了(le/liǎo)淵亭科技創始人(rén)洪萬福,聚焦“人(rén)工智能總體介紹及在(zài)疫情中的(de)應用”這(zhè)一(yī / yì /yí)主題進行直播分享,帶大(dà)家走近“人(rén)工智能時(shí)代”。
淵亭科技成立于(yú)2014年,是(shì)一(yī / yì /yí)家在(zài)廈門本土成長起來(lái)的(de)優秀人(rén)工智能企業,在(zài)金融、國(guó)防、公安政務等領域技術積澱深厚。淵亭科技于(yú)2019年11月獲得了(le/liǎo)市産業投資基金參股子(zǐ)基金中電中金基金和(hé / huò)廈門創投自主管理的(de)金創集智基金的(de)投資。
洪萬福:15年軟件行業從業經驗,擅長大(dà)型系統架構規劃、知識圖譜、自然語言處理等。曆任清華同方軟件出(chū)口首席架構師、Dell架構師等,主導設計過十幾個(gè)千萬-億級大(dà)型信息化系統。參與《工信部信通院-知識圖譜行業标準2018版》、《深度學習評估框架和(hé / huò)過程》多項國(guó)内及國(guó)際标準的(de)制定。2014年創立淵亭科技并推出(chū)DataExa産品系列(知識圖譜、AI中台等),專注認知智能方向在(zài)行業的(de)應用和(hé / huò)賦能。
以(yǐ)下爲(wéi / wèi)視頻會議精選内容——
一(yī / yì /yí)、人(rén)工智能概況
人(rén)工智能定義
人(rén)工智能是(shì)計算機科學的(de)一(yī / yì /yí)個(gè)分支, 它企圖了(le/liǎo)解智能的(de)實質,并生産出(chū)一(yī / yì /yí)種新的(de)能以(yǐ)人(rén)類智能相似的(de)方式做出(chū)反應的(de)智能機器,該領域的(de)研究包括機器人(rén)、語言識别、圖像識别、自然語言處理和(hé / huò)專家系統等。
“三次浪潮”
人(rén)工智能起始于(yú)1950年的(de)圖靈測試,而(ér)1956年的(de)達特茅斯會議标志着人(rén)工智能的(de)誕生,并用AI(Artificial Intelligence)代表人(rén)工智能。
人(rén)工智能共經曆了(le/liǎo)“三次浪潮”:第一(yī / yì /yí)次浪潮是(shì)1955-1958年,由感知神經網絡将人(rén)工智能推向第一(yī / yì /yí)個(gè)高峰,代表公司是(shì)美國(guó)的(de)DRAPA,由于(yú)當時(shí)算力、算法的(de)限制,此次浪潮很快陷入低谷;第二次浪潮興起于(yú)上(shàng)世紀八十年代,當時(shí)反向傳播算法獲得廣泛關注,參與人(rén)工智能開發的(de)主力軍是(shì)高校和(hé / huò)實驗室,但除了(le/liǎo)算力不(bù)足,當時(shí)還缺乏運算數據,所以(yǐ)第二次浪潮再次陷入低谷。目前我們處于(yú)快速發展第三次浪潮,互聯網(含移動互聯網)的(de)普及産生了(le/liǎo)海量信息的(de)數據,GPU、FPGA等芯片研發有效提升了(le/liǎo)算力,行業參與者也(yě)更加多樣化,民間機構紛紛投入研發,嘗試解決垂直場景問題,預示着本輪人(rén)工智能浪潮會持續很長時(shí)間。
機器學習
機器學習是(shì)對能通過經驗自動改進的(de)計算機算法研究,其中包含了(le/liǎo):監督學習(Supervised learning): 已知數據和(hé / huò)其一(yī / yì /yí)一(yī / yì /yí)對應的(de)标簽,訓練一(yī / yì /yí)個(gè)智能算法,将輸入數據映射到(dào)标簽的(de)過程。無監督學習(Unsupervised learning): 已知數據不(bù)知道(dào)任何标簽,按照一(yī / yì /yí)定的(de)偏好,訓練一(yī / yì /yí)個(gè)智能算法,将所有的(de)數據映射到(dào)多個(gè)不(bù)同标簽的(de)過程。弱監督學習(Weakly supervised learning): 已知數據和(hé / huò)其一(yī / yì /yí)一(yī / yì /yí)對應的(de)弱标簽,訓練一(yī / yì /yí)個(gè)智能算法,将輸入數據映射到(dào)一(yī / yì /yí)組更強的(de)标簽的(de)過程。強化學習(Reinforcement learning): 智能算法在(zài)沒有人(rén)爲(wéi / wèi)指導的(de)情況下,通過不(bù)斷的(de)試錯來(lái)提升任務性能的(de)過程,用于(yú)有勝負之(zhī)分的(de)場景,比如Alphago圍棋,告知機器規則後,機器将不(bù)斷試錯達到(dào)所需結果。以(yǐ)及半監督學習(Semi supervised learning) 和(hé / huò)多示例學習(Multiple instance learning) 。
深度學習是(shì)機器學習的(de)分支,是(shì)一(yī / yì /yí)種以(yǐ)人(rén)工神經網絡爲(wéi / wèi)框架,對數據進行表征學習的(de)算法,傳統的(de)機器學習需要(yào / yāo)人(rén)爲(wéi / wèi)先總結特征,比如研究航空公司如何降低油耗,需要(yào / yāo)先提取飛行數據特征如風向、飛行動作等,再同曆史數據對比找到(dào)存在(zài)規律,給機器設定起始态和(hé / huò)最終态,深度學習在(zài)中間的(de)特征提取部分,可由機器模拟人(rén)腦感知鏈條,自動提取特征,中間過程由機器模拟人(rén)腦感知鏈條,自動提取特征導出(chū)結果。
人(rén)工智能三層次
計算智能:運算能力和(hé / huò)存儲能力。例如1996年IBM的(de)深藍計算機戰勝了(le/liǎo)當時(shí)的(de)國(guó)際象棋冠軍卡斯帕羅夫,其主要(yào / yāo)靠的(de)就(jiù)是(shì)算力。
感知能力:機器的(de)視覺、聽覺、觸覺等感知能力。人(rén)類都是(shì)被動感知的(de),但是(shì)機器可以(yǐ)主動感知,例如激光雷達。
認知智能:獨立思考和(hé / huò)解決問題的(de)能力,通俗講是(shì)“能理解、會思考”。概念、意識、觀念等都是(shì)人(rén)類認知智能的(de)表現,但目前技術尚未成熟。
人(rén)工智能學派
符号學派:模拟人(rén)的(de)心智。認知智能、知識圖譜業務都屬于(yú)該學派。
聯結學派:模拟腦的(de)結構。
行爲(wéi / wèi)學派:模拟人(rén)的(de)行爲(wéi / wèi)。
近些年人(rén)們越來(lái)越意識到(dào)學派之(zhī)間相互融合的(de)重要(yào / yāo)性,比如“知識圖譜+深度學習”,試圖解決知識圖譜在(zài)邏輯推理能力強、泛化能力弱和(hé / huò)對深度學習不(bù)重視人(rén)類現有知識體系的(de)矛盾及問題。
人(rén)工智能三要(yào / yāo)素
數據、算法、算力(實際使用中還是(shì)以(yǐ)CPU海量廉價節點爲(wéi / wèi)主,GPU使用較少)。
人(rén)工智能進展及邊界
計算智能遠超人(rén)類,代表案例是(shì)深藍打敗國(guó)際象棋人(rén)類選手。
感知智能中,語音識别整體上(shàng)超越人(rén)類,代表案例是(shì)微軟2015年發布的(de)翻譯軟件。
圖像識别也(yě)屬于(yú)感知,圖像識别和(hé / huò)感知、認知計算不(bù)是(shì)一(yī / yì /yí)個(gè)層級,常規識别遠超人(rén)類(例如人(rén)臉識别),但泛化識别弱于(yú)人(rén)類。
認知智能中,文本挖掘的(de)常規任務接近人(rén)類,語義理解遠不(bù)到(dào)人(rén)類水平,情報分析與人(rén)類具有很強互補性。
決策控制屬于(yú)強人(rén)工智能(AGI:Artificial General Intelligence),其中無人(rén)駕駛可以(yǐ)在(zài)有限條件下使用,暫弱于(yú)人(rén)類;綜合決策要(yào / yāo)看所在(zài)領域的(de)複雜程度(例如Alphastar在(zài)星際争霸已達到(dào)宗師水平,AlphaGo碾壓人(rén)類圍棋選手)。
人(rén)工智能生态圈
基礎層:芯片/服務器、雲服務、計算平台/框架、數據服務等。
技術層:計算機視覺、自然語言處理(NLP)、機器學習等。
垂直應用層:智慧醫療、智慧教育、智慧金融、智能駕駛等,存在(zài)很多行業機會。
人(rén)工智能(以(yǐ)深度學習爲(wéi / wèi)代表)面臨的(de)問題
缺乏常識:例如2016年特斯拉交通事故,調查表明當時(shí)有7秒反應時(shí)間,但汽車訓練時(shí)沒有遇見過此類情形,錯誤反應造成事故。
可解釋性:例如銀行在(zài)傳統信用卡審批中采用評分制,過程可以(yǐ)解釋,但AI審批隻輸出(chū)結果,中間決策過程是(shì)個(gè)黑盒(卷積神經網絡CNN),因此不(bù)可解釋。
效率問題:機器學習認識一(yī / yì /yí)件事物需要(yào / yāo)大(dà)量多維度數據,同時(shí)配合相應算力,而(ér)人(rén)類在(zài)某些學習場景隻需要(yào / yāo)很少素材,比如兒童識圖。
安全隐患:比如在(zài)感知智能裏,給機器一(yī / yì /yí)些幹擾會影響識别準确率。
人(rén)工智能威脅和(hé / huò)倫理
失業危機:短暫性痛苦,但長期可以(yǐ)解決。
AI偏見:學習過程大(dà)量依賴語料,采集過程中會摻雜帶有偏見素材。
戰争用途:例如美軍研發殺人(rén)無人(rén)機。
人(rén)工智能重要(yào / yāo)發展方向
小樣本學習/小數據學習:人(rén)類在(zài)與世界的(de)觀察交互中學習、建立常識并完成新的(de)任務,并不(bù)需要(yào / yāo)如今智能系統的(de)海量标注數據或大(dà)量交互。
持續學習:人(rén)類的(de)學習可适應持續動态變化的(de)環境,目前的(de)機器學習一(yī / yì /yí)般是(shì)定期離線訓練,不(bù)能有效應對無時(shí)無刻都可能發生變化的(de)環境。
開放場景 通用AI:人(rén)類可以(yǐ)綜合利用各種智能解決不(bù)同問題,現階段的(de)智能系統通常僅能解決限定場景領域有清晰邊界的(de)問題。
可解釋性:時(shí)下最熱門的(de)深度學習方法往往是(shì)“黑箱子(zǐ)”,但缺乏足夠的(de)理論支持,對于(yú)重大(dà)決策問題或監管性的(de)任務,理解模型的(de)内部機制很有必要(yào / yāo)。
二、人(rén)工智能行業應用
目前,人(rén)工智能已經廣泛用在(zài)金融、安防、電信、醫療、教育、工業制造等領域。
淵亭科技服務案例有:
案例1(某銀行):幫助公司搭建消費金融征信風控大(dà)數據平台,通過結合運營商提供的(de)數據(BOSS計費、支付記錄等),精準識别客戶,在(zài)2017年電商雙11期間,在(zài)近600萬用戶中實現近79億的(de)交易額度。
案例2(某監管機構): 幫助監管機構,把央行條例解讀後寫成規則,重點挖掘賬戶異常交易和(hé / huò)行爲(wéi / wèi),解決人(rén)工漏報誤報問題,尤其在(zài)針對新出(chū)現的(de)洗錢手段上(shàng)效果顯著。
案例3(某券商):幫助券商搭建證券行業第一(yī / yì /yí)個(gè)智慧大(dà)腦項目,把所有數據(工商數據、宏觀數據、交易數據等)規整建立大(dà)數據庫,構建金融證券知識圖譜(宏觀經濟、産業鏈、企業畫像、産品服務),通過分析模型實時(shí)解讀新聞和(hé / huò)上(shàng)市公司公告,對事件風險預警的(de)準确率提升至59%-72%。
案例4(某監管機構):通過上(shàng)傳交易所數據,無監督學習建模,對可疑交易賬戶(特點窗口内對敲行爲(wéi / wèi))分組,再結合可視化行爲(wéi / wèi)分析,抓取操縱股價行爲(wéi / wèi)。
三、人(rén)工智能疫情防控應用
人(rén)工智能防控概況
這(zhè)次疫情傳播主要(yào / yāo)有四個(gè)痛點問題需要(yào / yāo)破解:如何阻斷傳播、病毒傳播溯源、調度優化、疫情監控。
目前人(rén)工智能在(zài)疫情防控中的(de)應用主要(yào / yāo)有:病例篩查(通過算法篩選)、藥物研發(AI臨床實驗、藥物分析)、無人(rén)服務(無人(rén)機器人(rén))、傳播控制(大(dà)數據分析)、日常管理(登記)、預警預防。
淵亭科技疫情作戰平台總體架構
正月初三,淵亭公司在(zài)國(guó)家疾控小組的(de)領導下,開始積極搭建疫情作戰平台,目前已通過工信部全國(guó)疫情防控評測認證,并推薦給各部委采購使用。
其中,數據采集模塊:最小集合包括确診人(rén)員信息、交通出(chū)行數據、運營商數據,最優集合包括社區數據、城市監控數據、互聯網第三方數據等。功能模塊:一(yī / yì /yí)是(shì)預警中心:聚集性疫情預警信息、關鍵節點發現預警、超級傳播源預警、高危群體防控預警。二是(shì)研判中心:針對疫情信息大(dà)數據,快速構建疫情圖譜,提供基于(yú)圖譜的(de)關聯分析、時(shí)空分析、流向分析等可視化分析手段,結合人(rén)員關系網絡快速挖掘關鍵節點及二三度人(rén)群等,幫助防控部門從根源阻斷病毒傳播途徑。
》》交流互動環節——
Q&A
Q:未來(lái)3-5年,淵亭在(zài)民用領域有哪些拓展計劃?
A:公司核心能力是(shì)知識圖譜,偏向情報分析,抓住圖譜賦能方法論就(jiù)可以(yǐ)實現跨行業服務。比如在(zài)工業互聯網領域,像内部管理、物料供應鏈管理都存在(zài)需求,淵亭可以(yǐ)帶動工藝水平提升,提高人(rén)效,難點在(zài)于(yú)數據标準化,特别針對中小企業。在(zài)民用領域方面,判斷社會服務性行業存在(zài)落地(dì / de)機會,比如無人(rén)超市,無人(rén)銀行。
Q:經曆此次疫情, AI未來(lái)會對政府公共管理可能産生哪些變革?
A:首先,國(guó)家層面會更加重視信息化建設,會深度挖掘,打通各個(gè)部門數據,優化數據庫;第二,應急指揮将迎來(lái)風口,過去傳統偏重硬件采購,未來(lái)建立智慧大(dà)腦,将更多應用大(dà)數據、雲計算等技術;第三,智慧城市更加深入、向正向發展。
Q:人(rén)機連接等AI技術發展未來(lái)是(shì)否可控,對人(rén)類是(shì)否構成威脅?
A:短期來(lái)看,在(zài)人(rén)腦控制機器操作、人(rén)機交融有應用場景,比例醫療領域輔助治療老年癡呆;而(ér)人(rén)腦機器增強,即機器意志代入人(rén)腦,對于(yú)AI是(shì)否對人(rén)類構成威脅,我認爲(wéi / wèi)所有技術科學的(de)最高境界應該是(shì)創造全新的(de)領域。
Q:AI在(zài)投資決策上(shàng)應用的(de)趨勢以(yǐ)及公司的(de)布局是(shì)什麽樣的(de)?
A:AI在(zài)金融應用時(shí)間較久,例如二級市場用機器學習做量化投資分析,還有之(zhī)前提到(dào)公司跟金融機構合作的(de)案例。其中關鍵點在(zài)于(yú)把投資特征量化成數據,以(yǐ)便機器學習。
Q:弱監督學習是(shì)否适用于(yú)方言學習,使得機器可以(yǐ)像人(rén)類一(yī / yì /yí)樣學習語言?
A:監督學習方言比較難,自然語言處理難點在(zài)于(yú)語言存在(zài)多樣性、歧義性和(hé / huò)上(shàng)下文語境,以(yǐ)及語言體系本身承載的(de)文化,監督學習更多關注的(de)是(shì)特征提取分析,沒辦法很好解決上(shàng)述問題。目前斯坦福大(dà)學在(zài)嘗試開發統一(yī / yì /yí)語言框架,試圖在(zài)英語範圍内,總結抽取語言的(de)通性,但不(bù)可能模拟人(rén)類天然學習語言方式。
Q:如何判斷AI邊緣計算芯片市場?
A:非常可觀,尤其在(zài)國(guó)防領域應用,例如現代戰争中,雙方實力對比懸殊,其中一(yī / yì /yí)方中央控制系統一(yī / yì /yí)旦遭遇打擊癱瘓,單兵作戰将受到(dào)限制;此外,戰場環境的(de)探測感知,也(yě)都需要(yào / yāo)用到(dào)邊緣計算。
》》淵亭科技
淵亭科技是(shì)一(yī / yì /yí)家專注于(yú)數據智能、緻力于(yú)“行業+數據智能”解決方案的(de)創新型公司。公司重點面向運營商、金融、軍政和(hé / huò)互聯網領域提供業界領先的(de)大(dà)數據應用産品與解決方案,爲(wéi / wèi)客戶打造全生命周期的(de)數據價值挖掘體系。公司自主研發了(le/liǎo)包括DataExa-Insight數據洞察平台、DataExa-Sati認知計算(知識圖譜)平台、DataExa-Suite(包括自然語言處理引擎、推薦引擎、規則引擎、社會網絡分析引擎、數據采集處理引擎和(hé / huò)數據分析挖掘引擎等組件)等産品,并利用該平台在(zài)各領域形成具備自學能力的(de)行業知識圖譜,将數據服務提升到(dào)知識服務。
》》廈門創投
廈門創投成立于(yú)2011年12月30日,目标成爲(wéi / wèi)中國(guó)專業的(de)母基金管理機構,打造在(zài)全國(guó)具有影響力的(de)政府引導基金管理品牌。廈門創投受托管理廈門市産業投資基金,涵蓋六大(dà)類型:廈門市産業引導基金、國(guó)家新興産業創投計劃參股基金、廈門市國(guó)企戰略發展基金、廈門市海絲投資基金、廈門市現代服務業跟投基金、小微企業創新創業基地(dì / de)示範城市專項基金。
廈門創投發起設立多隻市場化投資基金,投資優秀GP管理的(de)股權投資基金,并好中選優以(yǐ)跟投策略投資項目,構建不(bù)同投資策略組合,爲(wéi / wèi)投資人(rén)實現較低風險水平上(shàng)的(de)較高收益。截至2019年底,廈門創投直接、間接管理的(de)各類基金共計59支,基金總規模近800億元。