技術(shù)
導(dǎo)讀:2月20日,阿里云聯(lián)合視覺(jué)物聯(lián)舉辦了一場(chǎng)主題為“智領(lǐng)新視野:AI大模型助力視覺(jué)終端進(jìn)化新未來(lái)”的沙龍.
在人工智能(AI)技術(shù)加速融入并走進(jìn)千行百業(yè)的當(dāng)下,大模型的技術(shù)創(chuàng)新與多元化應(yīng)用無(wú)疑成為企業(yè)密切關(guān)注與競(jìng)相探索的焦點(diǎn)。
隨著技術(shù)的不斷突破,尤其是近期DeepSeek的爆火,再次在全球范圍內(nèi)掀起了一股AI普及狂潮。大模型以其強(qiáng)大的信息處理能力、高效的生成效率以及廣泛的應(yīng)用潛力,正逐步解鎖著各行各業(yè)數(shù)字化轉(zhuǎn)型的新路徑,為企業(yè)轉(zhuǎn)型升級(jí)、業(yè)務(wù)創(chuàng)新提供前所未有的驅(qū)動(dòng)力。
在此背景下,2月20日,阿里云聯(lián)合視覺(jué)物聯(lián)舉辦了一場(chǎng)主題為“智領(lǐng)新視野:AI大模型助力視覺(jué)終端進(jìn)化新未來(lái)”的沙龍,其主要圍繞大模型技術(shù)的發(fā)展脈搏,探討如何借助阿里通義大模型的技術(shù)優(yōu)勢(shì),推動(dòng)視覺(jué)消費(fèi)電子終端的智能化升級(jí)與場(chǎng)景化應(yīng)用。
活動(dòng)伊始,由阿里云大模型高級(jí)產(chǎn)品架構(gòu)師-蘇吉普圍繞《通義大模型的技術(shù)發(fā)展與產(chǎn)品化探索》進(jìn)行分享。在人工智能飛速發(fā)展的時(shí)代,大模型已成為推動(dòng)各行業(yè)變革的核心力量。阿里作為科技領(lǐng)域的巨頭,憑借著高質(zhì)量的數(shù)據(jù)、領(lǐng)先的算法框架、豐富的行業(yè)知識(shí)與生態(tài),推出了通義千問(wèn)大模型,并在長(zhǎng)期投入與持續(xù)演進(jìn)的實(shí)踐下,從基礎(chǔ)模型逐漸延伸到行業(yè)模型,其產(chǎn)業(yè)鏈不斷完善,生態(tài)日益壯大。
根據(jù)蘇吉普介紹,阿里云通義模型產(chǎn)品大家族由“3+1+N”構(gòu)成,即基礎(chǔ)模型、百煉以及領(lǐng)域應(yīng)用模型。當(dāng)前,基于Qwen系列二次開(kāi)發(fā)的衍生模型數(shù)量超9萬(wàn)個(gè),通義千問(wèn)已發(fā)展成為全球領(lǐng)先的模型家族。其中,大規(guī)模MoE模型Qwen2.5-Max的智能模型效果持續(xù)突破;AI推理模型QwQ-32B-Preview整體推理水平比肩OpenAI-o1-Preview;視覺(jué)理解模型Qwen2.5-VL-Max整體水平超過(guò)GPT-4V等。
阿里云百煉作為一站式模型調(diào)用平臺(tái),為終端行業(yè)提供模型、應(yīng)用雙引擎,致力于幫助企業(yè)快速構(gòu)建和部署高質(zhì)量的大模型應(yīng)用。該平臺(tái)提供了從數(shù)據(jù)處理、模型開(kāi)發(fā)/部署/管理到領(lǐng)域應(yīng)用等一系列工具和服務(wù),具備高度的可擴(kuò)展性和靈活性。
阿里云大模型高級(jí)產(chǎn)品架構(gòu)師-蘇吉普
接著,由阿里通義實(shí)驗(yàn)室高級(jí)產(chǎn)品架構(gòu)師-劉曉燕帶來(lái)《通義視覺(jué)大模型IPC行業(yè)方案分享》。發(fā)展至今,阿里巴巴已在大模型領(lǐng)域取得顯著成就,從M6項(xiàng)目到“通義千問(wèn)”的發(fā)展之路,阿里巴巴依托強(qiáng)大的技術(shù)實(shí)力、廣泛的應(yīng)用場(chǎng)景和豐富的生態(tài)資源,推動(dòng)著大模型的創(chuàng)新與應(yīng)用。
以Qwen2.5-VL為例,其是Qwen系列旗下全新的視覺(jué)理解模型,被官方稱(chēng)為“旗艦視覺(jué)語(yǔ)言模型”,較前身Qwen2-VL有重大飛躍,樹(shù)立了多模態(tài)AI新標(biāo)準(zhǔn)。據(jù)了解,該模型顯著增強(qiáng)了通用圖像識(shí)別能力,不僅能夠識(shí)別花、鳥(niǎo)、魚(yú)等常見(jiàn)物體,還能分析圖像中的復(fù)雜文本、圖表、圖標(biāo)、圖形和布局;而且還采用矩形框和點(diǎn)的多樣化方式對(duì)通用物體定位,可實(shí)現(xiàn)層級(jí)化定位和規(guī)范的JSON格式輸出,具備精準(zhǔn)的視覺(jué)定位能力。此外,Qwen2.5-VL將OCR識(shí)別能力提升至一個(gè)新的水平,擁有更加全面的文字識(shí)別和理解能力;同時(shí)設(shè)計(jì)了一種更全面的文檔解析格式——QwenVL HTML格式,能夠準(zhǔn)確地將文檔中的版面布局進(jìn)行精準(zhǔn)還原。此外,該模型不僅能夠支持小時(shí)級(jí)別的超長(zhǎng)視頻理解,還具備秒級(jí)的事件定位能力;通過(guò)利用內(nèi)在的感知、解析和推理能力,展現(xiàn)出不錯(cuò)的設(shè)備操作能力。
針對(duì)市場(chǎng)規(guī)模龐大的IPC行業(yè),劉曉燕老師介紹了千問(wèn)VL大模型技術(shù)在IPC巡家、IPC巡店、IPC巡園區(qū)、IPC巡城市等場(chǎng)景上的IPC產(chǎn)品與應(yīng)用案例,千問(wèn)VL為其提供了靈活、高效的解決方案,展現(xiàn)出強(qiáng)大的能力,驅(qū)動(dòng)業(yè)務(wù)形態(tài)的創(chuàng)新。
阿里通義實(shí)驗(yàn)室高級(jí)產(chǎn)品架構(gòu)師-劉曉燕
緊接著,由中科領(lǐng)創(chuàng)CEO-黃健帶來(lái)《中科領(lǐng)創(chuàng)加速I(mǎi)PC行業(yè)大模型落地實(shí)踐分享》。作為一家專(zhuān)注于AIOT的綜合服務(wù)商,中科領(lǐng)創(chuàng)核心業(yè)務(wù)是以電子元器件代理、軟硬件方案整合為主,為客戶(hù)提供云、管、邊、端系列化綜合服務(wù)。隨著技術(shù)的不斷進(jìn)步與應(yīng)用的不斷拓展,AI大模型在消費(fèi)行為預(yù)測(cè)、病蟲(chóng)害識(shí)別、游客體驗(yàn)升級(jí)、睡眠質(zhì)量與生命體征監(jiān)測(cè)、危險(xiǎn)事件預(yù)警、場(chǎng)景化內(nèi)容生成、智能監(jiān)控與溫控、個(gè)性化學(xué)習(xí)與教育、情感陪伴與互動(dòng)等場(chǎng)景應(yīng)用上展現(xiàn)出巨大的潛力。黃總表示,“大模型已逐漸從更安全、更清晰、更高效、更智能的功能價(jià)值向個(gè)性化、互動(dòng)性、陪伴性、情感寄托的情緒價(jià)值延伸?!?/p>
在此背景下,中科領(lǐng)創(chuàng)創(chuàng)建了大模型服務(wù)與開(kāi)發(fā)平臺(tái)。中科大模型平臺(tái)具有豐富多樣的模型服務(wù),大模型能力即開(kāi)即用,不僅提供優(yōu)質(zhì)開(kāi)源和閉源,文本、語(yǔ)音、圖片等多種模態(tài)大模型供選擇,同時(shí)也支持高性能的模型調(diào)用服務(wù)以及開(kāi)放的大模型三方生態(tài)合作,以高性能易調(diào)用、高開(kāi)放易集成、高可用易落地、超低價(jià)安全可信等優(yōu)勢(shì),助力企業(yè)打造最優(yōu)落地效果的大模型應(yīng)用。
中科領(lǐng)創(chuàng)CEO-黃健
活動(dòng)尾聲之際,迎來(lái)了分組討論環(huán)節(jié)。與會(huì)嘉賓們結(jié)合自身行業(yè)實(shí)際情況,就大模型應(yīng)用落地過(guò)程中可能遇到的挑戰(zhàn)等,與阿里云AI專(zhuān)家團(tuán)隊(duì)、中科領(lǐng)創(chuàng)CEO黃健等展開(kāi)深度的交流,剖析大模型技術(shù)的最新進(jìn)展、未來(lái)趨勢(shì)以及其在不同應(yīng)用場(chǎng)景下的潛在價(jià)值。在這場(chǎng)深度交流中,不僅有理論的碰撞,更有實(shí)踐案例的分享,無(wú)疑為參會(huì)者提供了寶貴的啟示與思考,也為推動(dòng)大模型技術(shù)在更廣泛領(lǐng)域的創(chuàng)新應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。
附現(xiàn)場(chǎng)圖片二維碼: