華為麒麟 970 國內(nèi)發(fā)布,這些 AI 應(yīng)用是否會(huì)變革智能手機(jī)?
9 月 25 日上午,華為在北京召開了麒麟 970 的媒體溝通會(huì),這也是麒麟 970 在國內(nèi)的首次亮相。和本月初在德國 IFA 電子展的首秀相比,在這一次的國內(nèi)溝通會(huì)上,華為公布了麒麟 970 更多的技術(shù)細(xì)節(jié)和具體應(yīng)用。
作為一款為手機(jī)設(shè)計(jì)的系統(tǒng)級(jí)芯片(System On Chip,即 SoC),麒麟 970 自然包含了常規(guī)的手機(jī) SoC 該有的部件,比如 CPU、GPU、ISP、DSP、通訊基帶,但和同類產(chǎn)品相比,麒麟 970 又多了一個(gè)所有同類產(chǎn)品都沒有的東西——一顆為人工智能運(yùn)算專門設(shè)計(jì)的 NPU。
下面我們就 SoC 的各個(gè)部件出發(fā),全面地了解一下麒麟 970。
CPU、GPU:重點(diǎn)是降功耗
CPU 方面,麒麟 970 的參數(shù)相比麒麟 960 基本沒有任何變化,依然是 8 顆核心,其中 4 顆為高性能的 ARM 公版 A73 架構(gòu),最高主頻 2.4GHz(麒麟 960 是 2.36GHz),4 顆位低功耗的 ARM 公版 A53 架構(gòu),最高主頻 1.8GHz(麒麟 960 是 1.84GHz)。有些遺憾的是,麒麟 970 并沒有用上 ARM 在今年 5 月發(fā)布的新一代 Cortex-A75、Cortex-A55 架構(gòu)以及為 AI 相關(guān)運(yùn)算優(yōu)化的 DynamiIQ 設(shè)計(jì)(麒麟 970 選擇了另一種方法來提高 AI 運(yùn)算)。當(dāng)然了,考慮到 A75 和 A55 的發(fā)布時(shí)間、設(shè)計(jì)的復(fù)雜程度,麒麟 970 沒用上也是可以理解的。
華為表示,表示麒麟 970 的能耗比提升了 20%(主要得益于全新的 10 納米制程),至于實(shí)際的性能表現(xiàn),不出意外的話,麒麟 970 應(yīng)該和麒麟 960 處于同一段位,不會(huì)有非常明顯的提升。當(dāng)然,橫向來看的話,麒麟 970 的 CPU 性能沒提升其實(shí)不是什么大問題。從 GeekBench 4 等跑分軟件的得分上看,麒麟 960 的分?jǐn)?shù)和高通驍龍 835、三星 Exynos 8895 基本處于同一水準(zhǔn),明顯強(qiáng)于聯(lián)發(fā)科 Helio X30。因此,即使麒麟 970 的 CPU 性能不變,也依然是 Android 陣營里移動(dòng) SoC 的頂級(jí)水準(zhǔn),只是不再像麒麟 960 發(fā)布時(shí)那么領(lǐng)先。
相比起 CPU 上的保守,麒麟 970 在 GPU 上的「誠意」要顯得更足一些。
首先,麒麟 970 則用上了 ARM 在今年 5 月剛剛發(fā)布的 Mali-G72 架構(gòu),理論性能相比麒麟 960 上的 Mali-G71 有所提升(ARM 的官方說法是相比 G71 性能提高 20%,功耗比提升 25%)。此外,在核心數(shù)上,麒麟 970 的 GPU 也從麒麟 960 的 8 核增加到了 12 核。
華為表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。照理說,由于麒麟 970 的 GPU 核心架構(gòu)比麒麟 960 更先進(jìn),核心數(shù)還多了 50%,并且制程更先進(jìn),GPU 性能提升的幅度應(yīng)該遠(yuǎn)不止 20%。之所以出現(xiàn)這種情況,很可能是華為將麒麟 970 的 GPU 主頻壓得比較低,從而更好地降低功耗(于是就有了提升幅度高達(dá) 50% 的能效比)。
實(shí)際的表現(xiàn)也印證了我們的猜測(cè),根據(jù)現(xiàn)場(chǎng)的介紹,麒麟 970 的 Mali-G72 最高主頻為 700MHz,相比麒麟 960 的 900MHz(部分場(chǎng)景下會(huì)飆到 1000MHz 左右)有明顯的下降,這種「多核 + 低頻」的策略讓麒麟 970 在性能有一定提升的同時(shí),功耗得以大幅度降低。
通訊基帶:比「千兆 LTE」更快
作為一家通訊行業(yè)有著多年積累的公司,華為海思在通訊基帶上有著深厚的「家底」,特別是去年的麒麟 960,直接在 SoC 中集成了支持 LTE Cat.12/13 的 Balong 750 基帶(最大下行速度 600Mbps,上行 150Mbps),并且支持 CDMA 網(wǎng)絡(luò),絲毫不遜色同期的高通驍龍 820、821。
在麒麟 970 上,華為海思更進(jìn)一步,直接大跨步到了下行 LTE Cat.18(上行最高 Cat.13),最高下載速度飆到了 1.2Gbps,也就是比之前業(yè)界最快、驍龍 835 和 Exynos 8895「千兆 LTE」還要再快上 200Mbps。
麒麟 970 還終于支持了在同時(shí)使用兩張 SIM 卡時(shí),主副卡同時(shí)用 4G(上一代麒麟 960 的副卡只能支持 3G),任意一張卡都可以使用 VoLTE 通話。此外,麒麟 970 還特別針對(duì)高鐵時(shí)的使用做了優(yōu)化,信號(hào)更穩(wěn)定,減少掉線。
不過話還是要說回來,雖然麒麟 970 的通訊基帶的確是厲害,但和驍龍 835、Exynos 8895 等支持千兆 LTE 的 SoC 一樣,普通用戶想要真正體驗(yàn)到這種超高速 LTE 網(wǎng)絡(luò),還得過上相當(dāng)一段時(shí)間。
ISP、DSP、Codec、協(xié)處理器
ISP 的全稱是 Image Signal Processor(圖像信號(hào)處理器),主要功能是處理相機(jī)傳感器中收集到的數(shù)據(jù)。
麒麟 970 的 ISP 主要是一些「常規(guī)升級(jí)」,依然是雙核設(shè)計(jì),擁有更快的速度,更快地對(duì)焦,更優(yōu)秀的降噪效果,并且對(duì)運(yùn)動(dòng)圖像的捕捉做了優(yōu)化。另外,針對(duì)目前很火的人像拍攝,麒麟 970 的 ISP 進(jìn)行針對(duì)性的優(yōu)化,可以根據(jù)不同膚色、帽子、眼睛、口罩、遮擋、側(cè)臉等多種復(fù)雜的人臉場(chǎng)景進(jìn)行優(yōu)化,改善了人像的拍照效果。
在 DSP、配套 Codec 等方面,麒麟 970 也有所提升,其中配套的音頻 Codec 可以支持 32bit/384k 的音頻解碼,過去幾代華為高端機(jī)(Mate、P 系列)上表現(xiàn)乏善可陳的內(nèi)放音質(zhì),有望在麒麟 970 這代產(chǎn)品上獲得明顯的提升,當(dāng)然前提是 Mate 10 和 P11 系列還能保留 3.5 毫米耳機(jī)插孔。
另外,麒麟 970 依然搭載了 i7 協(xié)處理器(和牙膏廠的 i7 沒啥關(guān)系),而 inSE(integrated secure element)和 TEE 安全引擎,在麒麟 970 上也都在。
在總線架構(gòu)上,不出意外的話,麒麟 970 采用的應(yīng)該是和 960 相同的 CCI-550。
10 納米制程,比驍龍 835 還多的 55 億個(gè)晶體管
制程上,不出意外,麒麟 970 用上了臺(tái)積電(TSMC)最新的 10 納米工藝,這應(yīng)該是繼蘋果 A10X、聯(lián)發(fā)科 Helio X30 之后,第三款采用臺(tái)積電 10 納米制程的移動(dòng) SoC。
通常來說,在芯片晶體管數(shù)量相同的情況下,更先進(jìn)的制程可以降低芯片的核心面積,有助于降低成本,并且更加有效地控制發(fā)熱和功耗。根據(jù)華為提供的數(shù)據(jù),臺(tái)積電的 10 納米制程可以降低 20% 的能耗,將芯片核心面積縮小 40%。
不過有趣的是,麒麟 970 的核心面積并沒有因?yàn)橹瞥痰倪M(jìn)步而縮小,反而比麒麟 960 還要略大,這是因?yàn)轺梓?970 集成了高達(dá) 55 億個(gè)晶體管,比麒麟 960 多出了 15 億。作為對(duì)比,蘋果的 A11 Bionic 芯片有 43 億個(gè)晶體管,高通驍龍 835 有 31 億個(gè)。
需要說明的是,雖然晶體管數(shù)量對(duì)性能有一定的影響,并且通常是越多越好,但在內(nèi)部部件眾多的、各家產(chǎn)品架構(gòu)甚至內(nèi)部組件都不太一樣(比如 A11 Bionic 沒有集成通訊基帶和專門的 NPU)的移動(dòng) SoC 中,我們是無法簡(jiǎn)單地用晶體管數(shù)量來判斷性能的。
NPU:首款內(nèi)置在手機(jī) SoC 中的人工智能芯片
終于到了麒麟 970 最特別的部分——NPU。
NPU 的全稱是 Neural-network Processing Unit,也就是神經(jīng)網(wǎng)絡(luò)處理單元。關(guān)于這顆 NPU 的功能,大家可以簡(jiǎn)單理解為專門高效地進(jìn)行 AI 相關(guān)計(jì)算定制的處理器,就像 GPU 之于圖形處理相關(guān)的計(jì)算,ISP 之于成像相關(guān)的計(jì)算。
傳統(tǒng)的 CPU(包括 x86 和 ARM)和 GPU 也是可以用來做深度學(xué)習(xí)計(jì)算的,但由于它們本身并不是專門為深度學(xué)習(xí)定制的,效率并不高。而麒麟 970 的這顆 NPU 采用了來自寒武紀(jì)(Cambricon)的 IP,專門為深度學(xué)習(xí)而定制,F(xiàn)P16 性能達(dá)到了 1.92 TFLOP,差不多是麒麟 960 的 3 倍(0.6 TFLOP 左右)。
在月初德國柏林的發(fā)布會(huì)上,余承東展示了一張?jiān)谶M(jìn)行 AI 運(yùn)算時(shí),NPU 和 CPU、GPU 的對(duì)比。
可以看到,性能上,NPU 是 CPU 的 25 倍,GPU 的 6.25 倍(25/4),能效比上,NPU 更是達(dá)到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。
在這個(gè) NPU 的基礎(chǔ)上,華為打造了 HiAI 移動(dòng)計(jì)算架構(gòu),大致的原理是通過一個(gè)統(tǒng)一的資源管理器,充分調(diào)用 CPU、GPU、ISP、DSP、NPU 等部分,app 開發(fā)者可以通過使用這個(gè)架構(gòu),提高 app 中和 AI 相關(guān)的應(yīng)用的處理效率(官方數(shù)據(jù)是 25 倍的性能,50 倍的能效優(yōu)勢(shì))。
在現(xiàn)場(chǎng)的演示中,華為展示了在進(jìn)行照片識(shí)別時(shí),麒麟 970 相比其他旗艦機(jī)具備明顯的優(yōu)勢(shì)。
根據(jù)華為提供的數(shù)據(jù),在包括 NPU 在內(nèi)的 HiAI 架構(gòu)的加持下,麒麟 970 每分鐘可以識(shí)別約 2000 張,iPhone 8 Plus 可以識(shí)別 889 張,iPhone 7 Plus 為 487 張,三星 Galaxy S8 只有 95 張(注:測(cè)試過程中,iPhone 應(yīng)該是調(diào)用了 GPU,三星 S8 應(yīng)該只是在用驍龍 835 的 CPU 在跑)。
除了單純?cè)谛g(shù)層面的「秀肌肉」,發(fā)布會(huì)上,華為還展示了麒麟 970 的 AI 能力在日常生活中的實(shí)際應(yīng)用,具體有下面幾個(gè)。
第一個(gè)功能叫做「慧眼」。麒麟 970 可以脫離網(wǎng)絡(luò)限制,直接在本地對(duì)物體進(jìn)行精確地識(shí)別,現(xiàn)場(chǎng)的展示中,華為把葡萄、蘋果等物體擺在搭載麒麟 970 的原型機(jī)之前,手機(jī)可以準(zhǔn)確地完成識(shí)別,并根據(jù)識(shí)別結(jié)果計(jì)算出對(duì)應(yīng)的卡路里。
第二個(gè)是 AI 降噪。大致的原理是通過深度學(xué)習(xí)算法,從而更有效地過濾周圍環(huán)境的噪音。這個(gè)功能最適合的使用場(chǎng)景之一就是在車內(nèi)等嘈雜的環(huán)境中進(jìn)行語音喚醒,華為表示,搭載麒麟 970 的手機(jī)(應(yīng)該就是 Mate 10 和 Mate 10 Pro 了)在車載場(chǎng)景下的語音識(shí)別率可以從 80% 提升到 92%。
第三個(gè)功能是 AI 美顏。這個(gè)功能和之前美圖在部分手機(jī)上的美顏技術(shù)類似,都是自動(dòng)檢測(cè)人臉并根據(jù)機(jī)內(nèi)算法進(jìn)行美顏,不過有了麒麟 970 相關(guān)的 AI 優(yōu)化,可以把這個(gè)美顏過程做得更加快速和精確。
第四個(gè)功能是智能自動(dòng)回復(fù)及情緒識(shí)別。麒麟 970 能夠?qū)ξ谋镜膬?nèi)容進(jìn)行提取,并根據(jù)文本內(nèi)容智能地進(jìn)行回復(fù)和提醒,比如說聊天中輸入文字「今天發(fā)工資了」,手機(jī)可以自動(dòng)聯(lián)想出開心的表情,輸入「敦刻爾克」,手機(jī)可以自動(dòng)推薦附近影院的觀影信息。類似的功能華為在榮耀 Magic 上就已經(jīng)嘗試過,在麒麟 970 的硬件平臺(tái)下,理論上可以做得更加快速和智能。
AI 加持的手機(jī) SoC
對(duì)于喜歡折騰手機(jī)的用戶來說,手機(jī) SoC 的性能可能永遠(yuǎn)都沒有「過剩」的那一天,不過對(duì)于更多的「普通用戶」來說,隨著過去幾年里 SoC 整體性能的不斷提升,新款 SoC 在性能上帶來的體驗(yàn)加成正在變得越來越小。在 5G 時(shí)代到來之前,在移動(dòng) VR 和 AR 應(yīng)用取得突破之前,這種情況很可能會(huì)一直持續(xù)下去。
在這個(gè)背景下,今年的各大芯片廠商紛紛把注意力投向了 AI。
除了額外增加一顆專門為 AI 相關(guān)運(yùn)算定制的芯片(NPU)、讓手機(jī)本身具備更好的 AI 處理能力的華為海思,蘋果在 A11 Bionic(中文名為「A11 仿生」)上,也重點(diǎn)強(qiáng)調(diào)了「每秒運(yùn)算次數(shù)最高可達(dá) 6000 億次的神經(jīng)網(wǎng)絡(luò)引擎」。在這之前,今年 5 月,ARM 在發(fā)布新一代 CPU 架構(gòu) Cortex-A75 和 A55 時(shí),重點(diǎn)強(qiáng)調(diào)了提高 AI 運(yùn)算能力的 DynamIQ 設(shè)計(jì)。今年 7 月,高通開放了自家的神經(jīng)處理引擎(Neural Processing Engine,NPE)的 SDK,幫助開發(fā)者使用驍龍 SoC 進(jìn)行 AI 相關(guān)的運(yùn)算。在 AI 席卷整個(gè)科技圈的浪潮中,以麒麟 970 為代表的手機(jī) SoC 在 AI 上的探索只是一個(gè)開始。
當(dāng)然,相比起這些技術(shù)和概念,用戶更關(guān)心的可能是 AI 究竟能給智能手機(jī)體驗(yàn)帶來多少變化,而對(duì)于麒麟 970 來說,我們需要等待的是即將在 10 月 16 日發(fā)布的華為 Mate 10 系列手機(jī)。
轉(zhuǎn)載36氪:http://36kr.com/p/5095274.html