導讀:人工智能的出現(xiàn),讓業(yè)務邏輯層開始發(fā)生翻天覆地變化。如何讓新技術(shù)從研究到研發(fā)逐環(huán)節(jié)培育轉(zhuǎn)移?如何讓新技術(shù)從原型到創(chuàng)新產(chǎn)品到核心產(chǎn)品逐層吸收應用?
圖片來自“123rf.com.cn”
先來想想未來。
未來的企業(yè)應用特征是社會化商業(yè)、網(wǎng)絡(luò)連接、數(shù)據(jù)智能
未來的信息化場景是企業(yè)互聯(lián)網(wǎng)-產(chǎn)業(yè)互聯(lián)網(wǎng)-社會化商業(yè)
未來的信息化產(chǎn)品體系是產(chǎn)業(yè)互聯(lián)網(wǎng)云服務、中臺與平臺、企業(yè)級云ERP
未來的數(shù)字化場景是智能零售、智能倉儲物流運輸、智能車間、智能辦公、智能城市
未來的數(shù)字化產(chǎn)品體系是智能硬件芯片、智能OS、IoT物聯(lián)網(wǎng)接入平臺、可視屏音箱助手
1.網(wǎng)絡(luò)連接:互聯(lián)網(wǎng)服務連接平臺、物聯(lián)網(wǎng)連接平臺、SaaS服務連接平臺、ERP集成平臺
2.數(shù)據(jù):數(shù)據(jù)中臺、大數(shù)據(jù)技術(shù)平臺
3.智能:人工智能技術(shù)平臺、人工智能應用中臺
未來的技術(shù)棧是:
用戶交互層:傳感器、人工智能視覺識別/語音交互
邏輯層:Open API Mesh、人工智能關(guān)聯(lián)推薦算法
數(shù)據(jù)層:人工智能精準搜索/關(guān)系圖譜、區(qū)塊鏈
1.IT服務:云訂閱服務、智能硬件
2.金融服務:大數(shù)據(jù)+AI驅(qū)動的金融信貸服務、大數(shù)據(jù)+AI驅(qū)動的金融科技服務(聚合支付服務、反欺詐服務、信用服務、實時風控服務)
3.業(yè)務服務:大數(shù)據(jù)+AI驅(qū)動的:社會化財稅自動化服務、社會化用工調(diào)度服務、社會化營銷數(shù)字化服務、社會化供應鏈資源調(diào)度服務
看,從客戶需求,到產(chǎn)品,到技術(shù),到商業(yè)模式,全不一樣了。面對未來,不管是中國BAT互聯(lián)網(wǎng)公司,還是中國企業(yè)軟件公司,還是國外的企業(yè)軟件巨頭公司,還是實業(yè)企業(yè)的科技公司,大家全都同一個起跑線,全都懵逼探索,就看誰從研究、戰(zhàn)略合作、資本融資與投資并購、組織與人才、激勵多方組合,誰能做到:選準、做對、跑得快,誰就能贏得未來。
人工智能專業(yè)發(fā)展了60年,一共折翼兩次。一次是剛剛發(fā)展起來,想通用解決問題,太樂觀,當然折翼。一次是90年代,吸收了第一次的經(jīng)驗教訓不搞通用了,專門做細分專業(yè)領(lǐng)域的專業(yè)系統(tǒng),但太依賴專業(yè)領(lǐng)域知識加工,還是沒法做成商業(yè)。
如何不強依賴專業(yè)領(lǐng)域知識呢?嘿嘿嘿,這就是這一次的發(fā)力重點:深度學習。這會對上層視覺識別、語音交互、自然語言處理三大應用領(lǐng)域都有加持助推效能。
而在深度學習領(lǐng)域,Google收購的英國DeepMind公司在這塊有兩個重大突破:神經(jīng)網(wǎng)絡(luò)(質(zhì)量)、TransFormer(性能)。所以,各種CNN(卷積神經(jīng)網(wǎng)絡(luò))、MTCNN(多任務卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、DNN(深度神經(jīng)網(wǎng)絡(luò))、ResNet(深度殘差網(wǎng)絡(luò))、LSTM(時間序列長短期記憶網(wǎng)絡(luò))、GAN(生成式對抗網(wǎng)絡(luò))。
模型改進:大規(guī)模無監(jiān)督模型GPT-2,并且結(jié)合了Attention機制,頗適合圖像生成質(zhì)量優(yōu)化。
算法改進:如BERT算法,頗適合NLP訓練質(zhì)量優(yōu)化。
當然,這些網(wǎng)絡(luò)結(jié)構(gòu)、算法、模型、機制都已經(jīng)被開源成深度學習平臺,這讓高深的人工智能走入普通IT公司:
Google:Tensorflow/Koras
Facebook:Caffe/Pytorch
微軟:CNTK/DMTK
AWS:MXNet
OpenAI:Open AI(目前尚無完全開源)
Apache:OpenNLP
百度:PaddlePaddle
Salesforce:TransmogrifAI
除了在算法模型平臺層有開源外,在其他幾個方面也湊在了一起:
算力芯片層:英偉達借助區(qū)塊鏈比特幣大風發(fā)展起來專用芯片GPU,也可用于人工智能。Google發(fā)布了TPU。
算力資源層:AWS、Azure云計算廠商都提供了人工智能訓練所需的IaaS服務,正好適合人工智能訓練這種波峰波谷的工作。
數(shù)據(jù)存儲層:AWS、Azure云計算廠商都提供了云分布式對象存儲服務、大數(shù)據(jù)存儲平臺、大數(shù)據(jù)計算平臺
數(shù)據(jù)集層:4G、智能手機/高清攝像頭、照片相冊云盤這三樣的普及,讓圖像數(shù)據(jù)積累快速膨脹。
所以說,這是學術(shù)界(算法模型)、工程界(開源)、云計算、智能手機移動互聯(lián)網(wǎng)四者疊加的效果。所以,為啥這次學術(shù)界的人紛紛加入產(chǎn)業(yè)界,就是因為這個原因,沒有數(shù)據(jù)沒有算力沒有應用場景,就沒法改進算法模型。
開源是個好東西。
我這里就是列了一些通用的、大面的。至于更詳細的,大家可以看:paperswithcode這個網(wǎng)站,浩如煙海的論文和代碼,你想要的都在這里。
一、視覺
OpenCV(Intel) DeepDream (Google)
人臉識別:InSightFace
物體檢測:Detectron(Facebook)
二、語音
語音到文字:wav2Letter(Facebook)
語音識別:kaldi(約翰霍普金斯大)
文字到語音:VoiceLoop(Facebook)、Merlin(英國愛丁堡大學)
三、NLP
搜索:Apache的Nutch、Luence、ElasticSearch
關(guān)聯(lián)推薦:PredictionIO (Salesforce) 關(guān)聯(lián)推薦算法庫LibRec (中國東北大學)
對話系統(tǒng):如DeepPavlov(莫斯科物理學院)、ParlAI(Facebook)、Texar(卡耐基梅隆大學)
通用NLP:Pytext(Facebook)、OpenNLP(Apache)、Spacy、AllenNLP、NLTK(賓夕法尼亞大學)、CoreNLP(斯坦福大學)、HaNLP(中國哈工大)、FastNLP(中國復旦大學)
四、深度學習
深度學習:Tensorflow/Koras(Google)、Coffe/Pytorch(Facebook)、微軟CNTK/DMTK、AWS的MXNet、百度的PaddlePaddle。Salesforce還針對Tensorflow出了一套簡化封裝的流水線TransmogrifAI
增強學習:Dopamine(Google)
五、機器學習/數(shù)據(jù)挖掘
算法庫:Spark MLlib、Numpy、Pandas
最早我們寫應用,是UI、邏輯、數(shù)據(jù)一體化,如DBaseIII。
后來出現(xiàn)了大型關(guān)系數(shù)據(jù)庫,我們才有了C/S結(jié)構(gòu),數(shù)據(jù)和應用分離。這是VB、PB、Delphi的輝煌時期。
后來又有了組件、容器中間件,所以我們才有了三層結(jié)構(gòu):UI層、業(yè)務邏輯層、數(shù)據(jù)層三者物理分離,而且三個層使用的技術(shù)也都不一樣。尤其是出現(xiàn)了多端的時候,萬金油程序員終于頂不住了,開始分離出專門的前端程序員(Web/移動App/小程序)。在數(shù)據(jù)層也是對象存儲、SQL、NOSQL、數(shù)據(jù)倉庫、大數(shù)據(jù)計算平臺各種技術(shù)組合,就出現(xiàn)了數(shù)據(jù)層的專門程序員。反而業(yè)務邏輯層的技術(shù)變化并不大,編程語言也基本就是JAVA了。
但人工智能的出現(xiàn),讓業(yè)務邏輯層開始發(fā)生翻天覆地變化。如何讓新技術(shù)從研究到研發(fā)逐環(huán)節(jié)培育轉(zhuǎn)移?如何讓新技術(shù)從原型到創(chuàng)新產(chǎn)品到核心產(chǎn)品逐層吸收應用?
對于前沿技術(shù),最佳的研發(fā)組織分工應該是:
1. 戰(zhàn)略合作:云計算廠商合作、開源社區(qū)界合作、學術(shù)界合作。從云計算廠商來看,微軟Azure很牛,開源社區(qū)Google很牛,學術(shù)界看了看香港很牛,港大、香港理工大、香港科技大、香港中文大學、香港城市大學都是榜上有名的??磥聿季执鬄硡^(qū)很有必要。
2. 科學家研究實驗室:戰(zhàn)略合作、論文閱讀理解、技術(shù)平臺選擇、原型算法原型模型原型應用快速突破驗證
3. 技術(shù)平臺研發(fā)中心:人工智能技術(shù)平臺正式研發(fā)、與科學家研究實驗室合作開發(fā)技術(shù)算法模型、對人工智能應用平臺暴露簡化后的API
4. 應用平臺研發(fā)中心:開發(fā)人工智能應用平臺、與應用雅畈中心合作開發(fā)應用算法模型、通過Open API平臺對外暴露簡化后的API
5. 應用研發(fā)中心:微調(diào)節(jié)應用模型、調(diào)用Open API平臺的一個API就直接應用了人工智能能力
6. 大客戶定制研發(fā)中心:微調(diào)節(jié)應用模型
最佳的研發(fā)流程應該是:
第一步 科學家研究實驗室(特種部隊尖刀連):搭建快而臟的原型,快速技術(shù)+應用驗證應用價值場景、技術(shù)使用性和技術(shù)成熟度,然后把成果轉(zhuǎn)移給創(chuàng)新產(chǎn)品研發(fā)中心
第二步 創(chuàng)新產(chǎn)品研發(fā)中心:創(chuàng)新產(chǎn)品研發(fā)中心接到成果,當做最佳實踐案例進行產(chǎn)品分析,然后對新技術(shù)模塊、新產(chǎn)品模塊,按照產(chǎn)品管理流程與質(zhì)量保證進行正式的微服務化設(shè)計(如可擴展、可定制、高性能、高可用、可實施、可運維)
第三步 核心產(chǎn)品研發(fā)中心:在創(chuàng)新產(chǎn)品商業(yè)推廣一年后,核心產(chǎn)品研發(fā)中心對核心產(chǎn)品進行新技術(shù)的吸收與利用,升級核心產(chǎn)品