很多從業者都在問,最近特別火的ChatGPT和它背後的通用人工智能《AGI》與AR之間究竟有什麼關系?
杭州靈伴科技聯合創始人向文傑給出了答案。
『未來人類跟通用人工智能的交互方式具有兩個特點:第一是自然交互,第二是多模態。
從這個角度來看,AR是人類與通用人工智能之間交互的入口,也是最佳載體,AR代表了未來的交互方式』
聚焦於人機交互技術的杭州靈伴科技在九年成長史中多次轉型、自我革新,見證了AR行業從興起到爆發的歷程。
眼下,以ChatGPT為代表的通用人工智能技術來勢洶湧,當AR遇上通用人工智能技術又會有什麼化學反應?
近日雷峰網與杭州靈伴科技聯合創始人向文傑進行了探討。
以下為雷峰網和向文傑的對話:
未來的大模型像雲計算一樣,變成基礎性底層技術
雷峰網:怎麼評價 ChatGPT 這個產品 ?
向文傑:ChatGPT的表現超出了大部分人的想象,讓人們看到了強人工智能的曙光,也帶來新的商業機會,給各個行業帶來顛覆。
雷峰網:未來 ChatGPT 的終極產品形態,會是什麼樣的?
向文傑:說一個我們期待的形態,未來的ChatGPT會從通用化變成個性化,進化成類似《鋼鐵俠》中的『賈維斯』或者是《HER》中的『薩曼莎』,成為個人的人工智能助理。
ChatGPT的底層的通用人工智能未來會成為基礎技術,類似雲計算的基礎設施。
新的生態將會基於它們來構建。
雷峰網:怎麼看當提問者對 ChatGPT 輸出的答案有異議時,ChatGPT 會立馬改口這種現象?
向文傑:這個現象讓人覺得ChatGPT更智能,更加智能並不是絕對正確,而是更像人的反應,會犯錯,會不懂裝懂,這些都更像是跟人在互動。
雷峰網:ChatGPT和國內大模型有代差,國內大模型的機會點在哪裡?
向文傑:從我們之前的經驗來看,做第一個突破是特別難的,當然正常情況下回報也更高。
技術一旦突破之後,後面的跟進會很快,目前GPT已經實現了技術路徑的突破。
其他跟進的大模型接下來就是投入問題和時間問題。
雷峰網:大公司做大模型,那麼中小創業公司的機會點在哪裡?
向文傑:這個跟雲計算也類似,中小創業公司要做的就是在通用領域做上層應用和服務,或者結合行業特點做垂直領域的模型。
AGI帶動AR產業,AR是人與大模型交互最佳載體
雷峰網:為什麼說AR是最合適的多模態終端設備?
向文傑:首先我們現在跟ChatGPT交互的方式是以文本輸入和輸出為主,這個還是太麻煩了,更好用的是直接跟ChatGPT講話,通過對話的方式進行互動,AR作為穿戴式設備天然具有這方面優勢,我們所有AR設備在語音交互上做的非常成熟。
其次ChatGPT未來是支持圖像理解,視頻理解,對外部直接的感知不需要人類來輸入,可以直接理解和感知,AR是穿戴式設備,天然有攝像頭、TOF等多種傳感器,傳感器的信息可以直接給到ChatGPT,讓它自己來理解環境並提供支持。
最重要的是,未來我們跟ChatGPT的交互方式是多模態交互,我們可以通過語音、手勢、文字、圖形以及視頻等多種方式輸入信息給ChatGPT,它反饋給我們的信息也可以是文本、語音、圖像、視頻以及3D模型等多種方式。
AR天然具備環境感知,手勢、語音交互,多模態展示等,可以通過AR的能力把ChatGPT的交互做的非常簡單和豐富。
相比於傳統的家庭大屏、車載大屏、智能手機、平板電腦、智能手表等傳統設備,AR是一個更好的載體。
雷峰網:接下來3年,杭州靈伴科技在 AGI上有什麼規劃嗎?
向文傑:未來的生態體系中,AIGC的提供方會非常多,我們的重點是將AR的交互能力持續迭代,跟AIGC或者AGI方面的交互體驗持續打磨,做最好的載體。
從AI到AI+AR,迭代人機智能交互方式
雷峰網:杭州靈伴科技從 AI 到 AI+AR轉型是基於什麼考慮?
向文傑:從外部視角來看,我們是從做語音智能賽道切換到AR賽道。
實際上,從公司內部的視角來看,我們並沒有切換賽道,公司一直聚焦下一代交互產品,基於AI+AR的全新的交互方式。
單獨的語音AI能夠提供的交互能力有限,隻有AI+AR結合起來,才能實現全新的多模態交互方式。
所以我們在14年成立了AI-Lab,專註於語音智能;16年成立了AR-Lab,專註於空間計算和手勢交互。
在2018年推出了第一款基於全語音交互的AR智能眼鏡Glass,後續又推出了面向工業端的AR智能眼鏡X-Craft ,還有今年推出的面向消費端的Max。
聚焦於AI+AR打造新的交互產品,改變人們的生活、學習、工作方式一直是公司的使命,這點從沒有改變過。
雷峰網:你們早期先做 ToC 還是 ToB?是如何進行轉型的?
向文傑:很多人覺得杭州靈伴科技很厲害,同時能做好ToB和ToC兩條線,而且從外部來看是先ToB然後轉型ToC,實際上不是這樣的。
從開始切入AR方向的時候,內部就一直有兩條產品線在推進,因為2018年到2021年這個期間,ToB端市場更成熟,所以更早地讓大家看到了我們ToB端的產品,但是公司內部ToC的產品一直在保持迭代和用戶驗證。
到了2021年C端的大門開始打開,也是因為之前的持續準備,我們站在了大門的最前排,2022年在C端取得了行業最好的成績。
我們在技術和組織能力上一直在深耕。
ToB和ToC的產品在底層算法,軟件硬件技術上有很多共同點,可以很好的復用。
此外, ToB 和ToC 方向上有相應的企業文化和配套組織機制,所以我們能同時支持好兩個團隊、做好兩個市場。
總體來看,ToB有更好的利潤,ToC有更快的成長,兩條腿走路,走的會更穩。
發力工業元宇宙,AGI是工業元宇宙新方向
雷峰網:在工業元宇宙賽道,杭州靈伴科技對比其他玩家有什麼競爭優勢?
向文傑:到今天,行業對工業元宇宙還沒有形成統一的認知,但是大家都有一個意識,即工業元宇宙是工業數字化發展向前推進的下一個階段。
在大數據、感知智能、通用人工智能、5G、數字孿生、IoT等各個技術都越來越普及的時候,把相關的技術融合起來,用新的終端賦能給到使用者,包含了管理者和一線的工人。
技術圍繞人來展開就是工業元宇宙跟傳統工業數字化最大的區別。
公司一直都聚焦在交互技術上,AR設備會是工業元宇宙的入口,我們一直在持續打磨技術和產品,目前的AR產品在工業場景下有很強的競爭力,在全球范圍內也有廣泛的影響力。
雷峰網:要做好工業元宇宙,需要解決哪些關鍵性問題?
向文傑:工業數字化發展到今天, 5G、雲計算、IOT等技術已經成熟並且不斷普及。
新的需要突破的技術包含了三個方面:
首先,通用人工智能技術在工業領域落地,極大的提高一線人員的工作效率, 把大數據的價值充分發揮出來;其次,AGI有效的降低數字孿生的構建成本,更快更好的構建虛擬世界;最後,AR設備和相關的空間計算的成熟和普及,普惠到每一個一線人員。
雷峰網:有人說,AGI是元宇宙的新方向,你怎樣看這個觀點?
向文傑:應該是一個必要的技術,能更快的、更低成本的構建數字孿生世界。
雷峰網:你說元宇宙的核心是人,為什麼?
向文傑:剛才講到了我們認為工業元宇宙是工業數字化向前發展的下一個階段,通過通用人工智能把數據的價值發揮出來,通過數字孿生和空間計算實現新的展示和交互方式,最後通過AR設備把這些能力賦能給到一線人員,實現『科技賦能於人』,打造更高效、更安全、更有成就感的『超級工人』。