吳軍長文講解算力:阿里雲的超級智算是「直道超車」

這兩天看到吳軍的一段訪談,絕對是在算力這個話題領域中最深入淺出的一篇講解了,把算力的概念、演進趨勢,再到與經濟發展如何掛鈎、中國算力產業的發展方向,做了一個非常完整的梳理。

其中,吳軍提到了算力競爭中,中國算力產業應該做的三件事:一是建設基礎設施規模,二是提升算力效率,第三是在基礎設施上提供足夠的開發能力。「把算力正式用起來,要把這些事做完了以後,這個算力才真正能夠惠及到企業,惠及到個人。」

整理了一下訪談全文放在這裡,內容比較長,耐心看:

提問:現在很多人說到算力都會想到礦機、比特幣,算力應該有一個更廣泛的含義,應該怎麼理解什麼是算力?

吳軍:算力我們得打一個比方能夠解釋得比較清楚。過去人類經常用來衡量各個國家或者各個文明時代它的文明程度的一個標準,就是能量,一個國家它的文明程度高,它使用和能夠產生的能量總量以及它的效率就會更高,比如我們說現代文明比古代文明能量要高,這是歷史學界慣用的一個方法。

到了近代以後,能量的重要性相對次要了,信息的重要性就很強了。舉個例子,幾秒鐘你就傳輸一部高清的電影,如果放到最早有電話的時代,用電話線來傳,那可能是幾萬年甚至是幾百萬年才能傳這樣一部電影,這就是信息它本身的進步。

算力本身跟信息這件事掛鈎,一個文明或者一個國家它能夠產生和利用的信息的總量,這個事和算力是掛鈎的。

信息我們怎麼用它呢?最基本的就是三個用法,第一個是我們要能夠處理信息,第二個要傳輸信息,第三個要存儲信息。這三件事今天都是通過計算機來完成的。計算機能夠處理傳輸和存儲的信息總量,我們一般可以把它看成是算力。

用我們熟悉的發電作比喻,發電量的背後是一台一台的發電機,也一樣的道理,算力的背後是一台一台服務器、處理器、芯片。

算力在過去70年的發展非常快,1946年出現了世界上第一台計算機,到2016年AlphaGo下棋贏了李世石,這個事很轟動,但如果用70年前的技術來算,那需要用百萬個三峽水電站的發電量來維持這盤棋,所以說算力的演進非常快。

一個是物理的演進,電子計算機出來以後,最早是真空管,可以理解成一個燈泡,它加熱了,紅了,能夠發出一點光,就可以開始工作了。當時計算機很龐大,大概用了幾萬個這樣的燈泡。它一旦啟動起來,老百姓家的燈泡就黯淡下來了,因為它實在是太耗電,每秒鐘只能算5400次。後來用硅做晶體管,取代了原來的燈泡,同樣的能量可以把計算提高100倍。第三部,大家發現把這些電路做到硅片裡頭,做集成電路,計算又提高了幾百倍,而且每十年提高几百倍,這個就是摩爾定律。

但到了2000年前後,這條路就停在哪裡了,為什麼?因為一個比小拇指的指甲蓋還小的芯片裡頭,它已經有了在幾十億個晶體管了,那個晶體管密得不得了,這個計算的速度相比電傳輸的速度來講,電傳輸速度已經是一個瓶頸了,不可能突破電的傳輸速度,所以它不太在提升了,還能提升,那就很慢了。所以,這時候是個分水嶺,進入了21世紀以後,大家追求的目標不再是單獨一個處理器它能提供多少算力,而是我要考慮到它用多少電,比如說每一度電提供多少個算力,標準基本上就改成這個。

這時候大家開始優化軟件,有A路徑B路徑C路徑,比如無人駕駛和挖礦就是不同路徑,按從2000年到現在,通過不同路徑,又把算力提高了幾萬倍。比如2000年以後出現智能化,就開始用專用芯片。

另一方面是商業。一開始龐大的計算機,耗電量那麼大,當時就是IBM做大型機,大家來組,他收每年的服務費,收的服務費,比如這一整套設備的費用每年收10%左右,IBM每年服務費收很多。我以前有同學在IBM工作,被派到花旗銀行去幹這種事。這是一個時代,就是大家租算力。

到PC機出現了,每個人家裡有電腦。我們就不租了,各個單位買了一大堆電腦,人手一台。但是電腦使用效率其實很低,除了上班幾個小時用,晚上都閒着。如果突然有個計算,這個任務特別繁重,我一下要用500台電腦,你是沒有的,你家裡不可能有500台電腦。單位里,這500台電腦這一年就用這一次,也不為你這一次去買這500台電腦。所以從租到不租,第二個階段還是有很多問題沒解決。

到了2000年以後,網絡速度變得特別快,能不能把所有的高性能服務器都放在一起,放到一個數據中心裡去,然後我再去賣算力。為什麼呢?效率比較高。我可以給大家一個數據,我原來在某一家大公司里工作,因為各個部門之間的電腦不是放在一起使用的,統計一下電腦處理器使用的效率不到10%,這已經是大型的計算機公司了。今天的數據中心,他們處理器的使用效率都在百分之七八十,一下子能夠提高七八倍的效率。其實這個就是我們今天說的雲計算,商業模式和IBM以前那種有點像,但其實完全不一樣了。

接下來要進入第四個階段,IOT的設備很多,有好多計算需求,很零碎,如果每次都把請求發到雲端再計算,效率實在太低。大家就想,比如說一個小區有一兩台服務性能比我們家電腦當然要強很多,那我也不需要雲計算中心那麼大的算力,一個中等規模的,你能做到多大呢?女生背的一個手袋吧,這麼大一個盒子,能夠處理一棟三四十層大樓的IOT計算的請求,就是做這個,中間狀態的它叫做邊緣計算。那麼城市和國家有超級計算中心,社區和小區有邊緣計算,是這樣一個過程。

提問:現在說全球進入了算力競爭時代,算力和經濟發展是怎麼掛上鈎的,或者說算力怎麼幫助和促進經濟發展?

吳軍:算力可以理解成發電量,根據發電量大概能夠判斷出經濟形勢怎麼樣,算力也是一樣的。從第二次工業革命以後,服務業它在全世界GDP中占的比重越來越高,傳統的工業農業就開始萎縮。今天一個國家經濟水平的高低不在於說你生產了多少輛汽車或者說日常消費品,而在於你提供了多少高端服務,金融的、科技的、醫療的、財務稅務的、法律的等等這些。

所有這些服務,它都跟計算機有關,你可以想象這些行業它都是離不開計算機的,比如醫院裡一個核磁共振的儀器,它是一台巨大的計算機。做好服務業,還有一個效率的問題,或者現在說是智能化的問題,舉個例子,一個律師打官司,為了打這個官司,你要看以前的很多卷宗,比如說5000個案例,用人來看,那效率很低,你找好多助手來看;你也可以用這個計算機來看,我們說人工智能可以閱讀這個案例,大家能夠明白怎麼回事,給你寫一份報告,但你就省了很多時間。

如果用人工智能來看,你就要用計算機,就是運行一些人工智能的程序。這些程序它很耗時間,比如你家裡只有一台蘋果電腦,你運行很長時間才能行,那你就需要通過雲計算來做到這件事,因為人工智能計算是很消耗算力的。你如果能夠提供算力,它就可以用AI來做一些在法律上的服務。這種例子有很多。

手機、電腦自己也有算力,這和雲計算的關係是什麼呢?打個比方,你家裡的算力相當於是你家裡有好多電池,你的電器你用這電池是沒問題的,你在家用一用,或者在耗電量不大的情況下,你用這電池來供電就行了。

雲計算公司提供的算力相當於插頭220的交流電,你到了哪,你帶一個插頭去就行了,你一插,插上就能用。如果你需要一個很大的算力,你們家的電腦就做不到,它可以提供,把電輸給你,你一插,那就享受到它的服務。你可以想象成,一個是家裡的電池,一個是牆上的220V。

當雲計算的公司提供更多的算力的時候,你家裡就可以做各種各樣和計算相關的事情,那麼你家裡的智能化程度也高,放在一個社會上,社會的智能化程度也高,或者說這個國家它的文明程度競爭力也就更強了。

當一個國家經濟到一定程度的時候,我們叫轉型、升級,越是升級,智能化程度越高的這就需要有算力做保障的。我們打一個比方,還是一開始講的電力,在第二次工業革命開始的時候,城市裡有好多馬車,當然也出現了電車,這個電車顯然比馬車效率要高,也清潔。但電車它能夠取代馬車的一個前提條件是說,你得發得出足夠多的電,當你能發得出足夠多電的時候,你的城市就升級了,蓋樓就可以往高了蓋,以前你不敢蓋100層樓,因為會爬死,必須要有電梯才能來做這件事。有了電以後,看上去很多產業還是原來的產業,但是它完全進行了一次現代化的升級。

那到今天,比如無人駕駛,他今天做的還不是很好 ,但大家吹得很厲害,覺得前景很好。是因為他提供出一種新的服務,以後不用買車了,根據我們日常工作的時間點,把我們的車自動安排好,後台當然有一些程序來幫我們安排這個。

做無人駕駛這件事它本身也是需要算力的,汽車裡頭有非常多的處理器,這樣才能保證安全行駛。為了保證無人駕駛汽車,他找的是最佳的路線,而且全程他做一個統一的規劃,不是一輛車一輛車的優化,讓全程的交通時間最短,它需要有一個雲計算中心來給他們提供信息,收集他們的信息,給他們做一個實時的指導說往哪去開。這個也需要算力在背後的幫助。

算力對於我們信息時代的作用,有點相當於電對於第二次工業革命時候,就是19世紀末到20世紀初那個時代的一個作用。

提問:把算力和電力的比喻特別清楚,那如果把算力作為一個產業,這個產業的有什麼優勢和看點?中國的算力產業又有什麼特點優勢?

吳軍:這是個很具體的問題,我舉個具體的例子,國內現在最大的雲計算公司是阿里雲,它涉及到了計算的方方面面,我就拿它做例子講。

剛才講了算力比喻成發電,不是說光買了好多發電機組放在那,這個電自然就發出來了。即使電發出來了,你還有一個調度,怎麼能夠把這個電送達給每一個終端的用戶,然後這個終端用戶拿到這個電以後,就是虛無縹緲的東西,也不能放我手上——這個算力也是一樣,也是個虛無縹緲的東西,還得能夠把它用上。

這裡至少要做3到4件事,第一個你本身得有足夠強的發電能力,這個沒有問題。比如說阿里雲,它最新的一個超級數據中心或者叫智能數據中心,它提供了一個算力有12EFLOPS。這個概念比較抽象,大家不好理解這個算力有多強。如果大家用最新款的M1的蘋果電腦,大概相當於1000萬台的蘋果電腦它產生的一個算力。

為了提供足夠多的算力,他做了三件事。第一件事就是我得把所有的這些提供算力的處理器管理起來,管理好,就像所有的發電機組在一個電網裡,你要有效的工作,它這個電網的調配,這是非常重要的一件事,你調配不好,它就互相打架。在計算機上,我們有一個概念叫操作系統,就是雲計算它有一個操作系統,它來完成這件事。

第二件事在它的數據中心裡,剛才講了不可能放1000萬台的計算機,太耗電了,體積也很大。針對人工智能或者一些特殊的應用,它做了一些優化,可以使得同樣耗電量的處理器來處理很多專門的需求,特別是人工智能方面的需求,它的效率提升幾倍到幾百倍,就是看不同的需求提升的效率不一樣。你要提升幾百倍,比如原來需要1000萬台電腦,它在數據中心現在幾十萬台大概就能達到同樣的效果。

第三件事就是一個網絡,我們知道電輸出去要有電網,你得建這個電網,這個電網如果電線太窄、太細了是不行的,發電的功率很大,電線太細就燒掉了,所以變電設備所有的這些都要配套。智算中心也是一樣,跟網絡有關的所有的技術都要做一次升級,使得這個算力能夠輸出,否則好多機器在發電,接一根很細的電線,往外輸電輸不出去。

這三件事之後,還有一件事也是很重要的,算力空空的拿在手上,就跟電拿在手上沒用,為什麼電被接受了?是我們用了一些看得見摸得着的實實在在的電器,比如說最早用的燈泡,愛迪生發明了留聲機,我們後來有了電冰箱、彩電、洗衣機等等,電器它能夠使得我們的電產生效果。算力這個事,如果能夠讓我們每個人受益也是一樣。

剛才講的要用無人駕駛汽車,你就得有一個智能的人機接口,就人和計算機的接口,比如說我自己不懂人工智能,但是我用你這個智能接口提供的一個APP,我就直接能夠應用好這個算力。剛才說提供算力的公司也要提供相應的應用程序,就這相當於給用戶提供燈泡,這是給終端用戶。

還有一些算力給企業的,相當於你把電動機賣給企業,但這個企業的電動機一般工人還要有一個學習的過程,提供算力公司,比如像阿里雲,他們還要去給企業做一些二次開發,把算力正式用起來。要把這些事做完了以後,這個算力才真正能夠惠及到企業,惠及到個人。

提問:既然算力對經濟發展這麼重要,那我們今天說中國算力去參與全球競爭,這個裡面的決定性因素是什麼?

吳軍:這裡大概有幾點,我還是用電力來比喻,比如法國的法國的核電發展特別好,它自己用不完,就輸出到歐洲其他國家去了,德國缺電,只好向法國買電,這是一個很重要的。比如我們剛剛說到的阿里雲,它在全球排第三,但如果和谷歌那個全球最大的智算中心比,它剛剛建的這個比谷歌還打。這相當於我的總發電量雖然沒你多,但我新建的發電站已經比你多了,這對國家的競爭力是一件非常好的事情,可以說明競爭力很強。相當於建了個三峽大壩,這是世界上最大的水電站。

第二點是效率問題,比如發同樣的電,你家裡用了一個白熾燈泡,60瓦的,達到一個亮度,現在你提高了效率,用了一個不到10瓦的白熾燈泡,也有同樣的效果。比如算力公司,還是拿阿里雲和美國一家做人工智能的叫OpenAI的公司來舉例子,他們要訓練一個人工智能的模型,取得同樣的效果——比如燈泡的亮度,誰需要算力更少,更經濟,更節約?我知道阿里雲在OpenAI之後做了一些計算底層的改進,結果算力只要美國公司的不到十分之一,很小的一個數量級就達到了同樣的亮度。

我講一個歷史的故事,在19世紀80年代,芝加哥的世博會上,世博會想用電燈把晚上都給照亮,就問特斯拉和愛迪生,你們誰能做到這一點,誰能夠更有效的來輸電。同樣發電都沒問題,特斯拉也能發,愛迪生也能發,但是特斯拉採用了交流輸電,它輸電的效率能夠做到非常高。愛迪生直流輸電,輸電的效率比較低,遠了就不行,只能在世博會的現場建一個電站才能提供這麼多照明的燈。最後的競爭,特斯拉贏了,愛迪生輸了。特斯拉一輩子的英明在於交流輸電這件事上打敗過愛迪生一次,這就涉及到一個效率,你不光能發出這麼多的電,最後能夠保證同樣電讓更多的電燈亮起來,就是算力和效率的關係。

第三個是開發的問題,比如說日本在電器時代曾經是世界上的老大,是領頭羊。為什麼了?因為全世界用的終端電器都是日本的。同樣的道理,如果把整個的算力在全世界輸出出去,或者說處於一個領跑的地位,在這個上面智能化的APP以及各種工具,各種API的接口,這個要做得好。我們今天在全世界最大的雲計算公司,還是亞馬遜。亞馬遜做得好的主要原因,它的API做得好,就是各種接口做得好,無論是銀行系統的,還是保險業、一般的工業生產,包括做媒體的,他提供是非常多。打個比方,甭管買一個什麼樣的房子,一個小的單件或者一個大的豪宅,他都能給你配上電器。

在這方面中國的算力企業還有很長的路可以走,在雲計算的基礎上應該會有更多的軟件公司和服務公司,他們來參與做APP和API的開發。

提問:那在這三點的前提下,作為中國的算力企業,如果想要在全球競爭中占有一席之地,應該往哪個方向發力呢?

吳軍:中國經常說一個詞是彎道超車,其實我非常不喜歡這個詞,我自己有體驗,我自己是開超跑的人,假如你開一個豐田的,我開一個保時捷的911,我一腳油門踩下去,甭管領先多少,一瞬間就超過去了。

剛才講到了阿里雲的超大智算中心,他做這件事很重要,你不要老想着這個小技巧,我就造一個全世界算力最強的數據中心,這個事的意義就很大,我就造一個保時捷出來,就秒殺豐田的這些車,我不用去考慮是不是要彎道,直道就直接超了,這是第一個。

第二個我們剛才講了好多商業,商業對技術的拉動,我們很多工程師老忽視這一點。我投資那麼一家公司,他們要有很大計算量,然後考量了所有的雲計算公司,最後發現亞馬遜服務做得特別好,提供的APP或者API特別的多。不管你買什麼樣的房子,我都能給配電器,這點還是非常重要的。我們很多國內企業,商業上還有很長的路要走。

中國雲計算企業現在在全球的競爭中,還有兩個點可以看一下,第一是我們成本優勢,同樣造一樣東西,從工業的角度來講,無論是阿里巴巴也好,包括現在的字節跳動,他們做了很多IT基礎服務,成本還是比較低的。第二是從地緣上看,亞太有一些新的工業上起步的企業,IT是蠻落後的,比如像越南、印度,這兩個國家是不能忽略的。跨國公司比如說亞馬遜賣到印度,賣到越南,並不是那麼直接,這不是很划算的一件事情;提升他們這些國家的it水平,這個是中國應該做的事情。

我最後要說一下的是算力獨立自主的意義,我們老拿電來舉例,電網是你自己國家的,最典型的是你看德國被俄羅斯控制,你一旦出點事就很麻煩。你可以把算力的安全和糧食安全、能源安全劃等號,你自己需要有發電能力,有電網等等,你自己能夠產生算力,能夠把算力由網絡輸入到每一個終端用戶。然後你有額外的算力,你可以往全世界來輸入,這個你可以理解成糧食安全和能源安全。