Video: Если бы АМД не было (Nobyembre 2024)
Sa isang serye ng mga kamakailan-lamang na mga anunsyo, ang Intel at AMD ay magkahiwalay na nagbigay ng ilang mahalagang mga pagbabago sa mga arkitektura ng kanilang mga x86 na mga processors, na nangangako na ibabago ang paraan ng mga prosesong x86 na gagamitin sa susunod na ilang taon.
Noong nakaraang linggo, inihayag ng AMD ang isang bagong arkitektura ng memorya na naglalayong dalhin ang computing ng CPU at GPU. Inihayag ng Intel ang isang bagong diin sa pagpapabuti ng posisyon nito sa mas tradisyonal na PC graphics. Kahapon, inihayag ng Intel ang isang ganap na bagong bersyon ng microarchitecture para sa mga serye ng Atom nito, isa na dapat gawin ang mga chips na mas malakas at potensyal na isara ang agwat sa pagitan ng Atom at higit pang mainstream na pamilya ng pamilya ng mga processors.
Bagong Memory Architecture ng AMD
Ang pag-anunsyo ng AMD tungkol sa tinatawag na heterogenous Uniform Memory Access (hUMA) ay hindi isang malaking sorpresa, dahil ang kumpanya ay pinag-uusapan tungkol sa Heterogeneous Systems Architecture (HSA) sa loob ng mahabang panahon.
Ang konsepto ay medyo simple. Kahit na sa isang maliit na tilad na mayroong parehong CPU at ang pagproseso ng graphics (GPU) sa parehong mamatay, tulad ng sa pinabilis na pagproseso ng mga yunit (APU) ng AMD, ang memorya na ginamit ng CPU at graphics ay nanatili sa magkahiwalay na pool. Habang mayroong pisikal na parehong memorya, ang CPU at GPU ay gumagamit ng iba't ibang mga payo sa memorya. Upang magamit ang GPU para sa pag-compute, dapat kopyahin ng isang programa ang data mula sa bahagi ng memorya na ginamit ng CPU sa bahagi na ginamit ng mga graphic, gawin ang pagkalkula, at kopyahin itong muli. Ang lahat ng ito ay tumatagal ng oras. Sa isang tunay na pinag-isang sistema ng memorya na may kasamang mga graphics, hindi ito kinakailangan.
Itinulak ito ng AMD bilang bahagi ng HSA Foundation, na kinabibilangan ng ARM, Qualcomm, Samsung, Texas Instrumento, MediaTek, at imahinasyon. Sa partikular, ang pamamaraang ito ay gumagamit ng isang software na runtime na kilala bilang HSAIL at isang hanay ng mga interface para sa pinabilis na aplikasyon ng HSA.
Sa linggong ito detalyado ang AMD kung paano sa kanyang arkitektura ng hUMA ang CPU at GPU ay maaaring pabalikin ang paglalaan ng memorya mula sa buong puwang ng memorya at gamitin ito kasama ang parehong pamamaraan ng virtual addressing. Ang memorya ay magiging magkakaugnay na pagtuturo upang ang anumang pag-update sa memorya na ginawa ng CPU o GPU ay makikita ng iba pang mga elemento ng pagproseso. Susuportahan ng GPU ngayon ang memorya ng memorya, kasama ang mga virtual na pahina, kaya't maaari itong gumana sa mas malaking mga database (ang paraan na kasalukuyang gumagana ang mga CPU). Ang ideya ay ang CPU at GPU ay maaaring gumana nang mas mahusay. Sinabi ng AMD na maisusulat ng mga developer ang mga application na pinabilis ng HSA gamit ang mga karaniwang mga wika sa programming tulad ng Python, C ++, at Java.
Ang AMD ay hindi lamang ang kumpanya na nakikita ang heterogenous computing bilang mahalaga at ang HSA Foundation ay may mga kakumpitensya din. Si Nvidia ay naging isang malaking tagasuporta sa kung ano ang ginamit nito upang tawagan ang GP-GPU, itulak ang mga CUDA na mga API, at ipinangako na ang isang hinaharap na bersyon ng mga processor ng graphics nito ay susuportahan ang pinag-isang memorya. Ang ilan sa mga malalaking platform ng software ay may sariling mga kahalili: ang mga DirectCompute ng extension ng Microsoft sa DirectX para sa computing ng GP-GPU at Renderscript API ng Google para sa heterogenous computing. Marahil ang pinakamahalaga, ang Khronos Group, isang consortium sa industriya, ay nagtataguyod ng pamantayan sa OpenCL.
Ang malaking katanungan ay alin sa mga pamantayang ito ang maakit sa mga nag-develop. Ang unang processor ng AMD upang suportahan ang hUMA ay ang Kaveri processor nito, naipadala sa katapusan ng 2013 (bagaman malamang na hindi sa mga sistema hanggang sa unang bahagi ng susunod na taon). Nagbibigay din ang AMD ng APU para sa PlayStation 4 at malawak na napabalita na nagbibigay ng APU para sa susunod na henerasyon ng Xbox. Tila malamang na ang ibang mga miyembro ng HSA Foundation ay maaaring gumamit ng arkitektura ng hUMA, kahit na wala pa ring ipahayag ang anumang mga disenyo. Sama-sama, ito ay maaaring sapat upang lumikha ng kritikal na masa para sa mga developer at para sa mga tool at kung gayon, ito ay maaaring maging napakahalaga.
Bumagsak ang Intel Doubles sa Graphics para kay Haswell
Late noong nakaraang linggo ang Intel ay nagpahayag ng higit pang mga detalye sa darating na ika-4 na processor ng Generation Core, isang produktong 22nm na kilala bilang Haswell. Naunang isiniwalat ng Intel ang isang bilang ng mga bagong tampok para sa Haswell kasama na ang mga bagong tagubilin sa AVX2 para sa pagtatrabaho sa mas malaking vegertor ng integer at mga fused na pagdaragdag-add (FMA) para sa lumulutang na punto. Ang mga bagay na ito ay hindi malamang na makita ng mga gumagamit, maliban sa mga tuntunin ng pinahusay na pagganap sa halip na mga dalubhasang mga workload.
Ano ang pinaka-kagiliw-giliw na tungkol sa bagong anunsyo ay ang pagtuon sa mga graphic, isang lugar kung saan ang mga kakumpitensya na AMD at Nvidia ay tiyak na nanguna.
Ngunit ang Intel ay nagsasagawa ng ilang mga malalaking hakbang sa mga processor ng Haswell. Matagal nang sinabi ng Intel na magdaragdag ito ng higit pang mga graphics sa mamatay para sa ilang mga modelo ng Haswell, kabilang ang isang high-end na bersyon na kilala bilang GT3. Epektibo, ito ay lamang ng karagdagang mga yunit ng pagtuturo ng graphics, sa itaas ng mga halaga sa kasalukuyang mga processors ng Ivy Bridge. Sa pamamagitan ng kanyang sarili ito ay isang malaking pagbabago na ibinigay na sa mga produkto nito ang Intel ay karaniwang nakatuon ng mas maraming puwang na mamatay sa puwang ng CPU habang ang nakikipagkumpitensya na mga APU ng AMD ay nakatuon ng mas maraming puwang na mamatay sa mga graphics.
Ngunit kamakailan lamang na ipinakita ng Intel ang isa pang variant, kung ano ang tinatawag nito na mga GT3e graphics, na nagdaragdag ng isang pangalawang kamatayan na may 128MB ng naka-embed na DRAM sa pakete na naglalaman ng Haswell mamatay, at idinisenyo upang mapabilis ang pagganap ng graphics. Noong nakaraang linggo, inihayag ng Intel na ang mga mas mataas na bilis ng mga bersyon ng GT3 graphics ay tatawagin ngayong Iris, at ang mga may naka-embed na DRAM ay tatawaging Iris Pro, dahil inaasahan ng Intel na makakuha ng ilang mga bentahe ng branding ng mga bagong antas ng graphics.
Sa partikular, ang linya ng Haswell ay ibabahagi ng mga bersyon na may isang maliit na halaga ng mga graphics (GT1) na tinatawag na HD Graphics; kasama ang mga graphics ng GT2 (katumbas ng high-end ng linya ng Ivy Bridge) na tinawag na HD Graphics 4200 hanggang 4600, depende sa bilis; na may mga graphic na GT3 ngunit tumatakbo sa 15 watts na tinatawag na HD Graphics 5000; ang mga bahaging ito na may mga graphic na GT3 na tumatakbo sa 28 wat at pataas ay tatawagin na ngayong Intel Iris Graphics 5100; at ang mga may graphics na GT3e at naka-embed na mga graphic na tinatawag na Iris Pro 5200. (Ang Intel ay hindi kailanman naging isa para sa pagpapangalan ng pagiging simple.)
Ang mga bahagi ng Intel ay nananatiling kumplikado ngunit tandaan na ang isang bahagi na nagsisimula sa 4 ay nagpapahiwatig kay Haswell habang ang isa na nagsisimula sa isang 3 ay nagpapahiwatig ng Ivy Bridge. Ang kumpanya ay gumagamit ng MQ upang ipahiwatig ang karaniwang mga bahagi ng GT3 notebook at HQ upang ipahiwatig ang mga bahagi na may naka-embed na DRAM.
Bilang bahagi ng anunsyo, ibinahagi ng Intel ang mga numero ng pagganap para sa mga bagong bahagi, na nagpapakita ng makabuluhang pagpapabuti ng pagganap kumpara sa umiiral na mga processors ng kumpanya. Nagpakita ang Intel ng mga numero na nagmumungkahi ng pagganap ng Ultrabook hanggang sa 1.5 beses sa nakaraang henerasyon nang halos pareho ang pagkonsumo ng kuryente (at dalawang beses ang pagganap na may isang mas mataas na wattage chip na naglalayong bahagyang mas malaking notebook, mga may 14-in at mas malaking mga screen), dalawang beses ang graphics pagganap sa tradisyonal na mga notebook, at halos tatlong beses ang pagganap sa mga desktop system.
Sinabi ng Intel na ang bagong Iris at Iris Pro graphics ay maihahambing sa discrete GPUs, at malaki ang pakikitungo nito. (Tulad ng lagi, kukuha ako ng lahat ng mga numero ng pagganap na may isang butil ng asin hanggang sa maaari ko talagang masubukan ang mga produkto.) Sigurado ako na magkakaroon pa rin ng mas mataas na pagganap na mga bahagi ng graphic na diskete mula sa AMD at Nvidia para sa mga aplikasyon ng gaming at workstation, ngunit karaniwang ang mga bahaging ito ay gumagamit ng maraming lakas. Sa buong laki ng mga laptop kung saan mas maliit ang sobre, ang mga mamatay na graphics ay mas mahalaga ngunit mayroon pa ring isang malaking merkado para sa mga discrete graphics. Tila target ng Intel ang merkado. Ang mga Ultrabooks at iba pang mga manipis na notebook ay karaniwang hindi nagkaroon ng kinakailangan ng lakas upang magpatakbo ng mga hiwalay na graphics, kaya't pinabuting ang mga pinahusay na on-die graphics.
Ang Bagong Atom Microarchitecture ng Intel
Sa maraming mga aspeto, gayunpaman, ang pinakamalaking anunsyo mula sa Intel ay itinuturing na mababang-kapangyarihan na arkitektura, na nakalaan upang palitan ang arkitektura na ginamit sa kasalukuyang arkitektura ng kumpanya. Karaniwang kilala ang pamilyang Atom para magamit sa mga mobile device, tulad ng mga tablet at sa mas kaunting lawak ng ilang mga matalinong telepono. Ang bagong arkitektura, na kilala bilang Silvermont, ay naglalayon din sa iba't ibang data center at naka-embed na merkado.
Ang arkitektura ay kumakatawan sa isang malaking pagbabago. Sa halip na in-order na pagpapatupad ng engine na ginamit sa mga nakaraang bersyon ng arkitektura ng Atom, kasama ang arkitektura ng Saltwell na ginamit sa kasalukuyang 32nm na bersyon ng Atom, idinagdag ni Silvermont ang isang out-of-order na pagpapatupad ng makina, tulad ng ginamit sa mga processor ng Core at Xeon ng Intel. . Ito ay dapat na makabuluhang mapabuti ang pag-proseso ng application na solong may sinulid. Nag-aalok ito ng isang bagong arkitektura ng tela ng system, na idinisenyo upang masukat hanggang walong mga cores (malamang para sa mga aplikasyon tulad ng mga micro-server). Sa wakas, nagdaragdag ito ng mga bagong tagubilin (upang gawin ito sa isang par sa mga ginamit sa Westmere bersyon ng mga processors ng Core), at mga bagong teknolohiya sa seguridad at virtualization.
Ang bagong arkitektura ay may isang modular na disenyo batay sa paligid ng mga module na naglalaman ng dalawang cores, 1MB ng ibinahaging L2 cache (napakababang latency, mataas na bandwidth), at isang nakatuon na point-to-point interface sa tela ng SoC. Tandaan na pinapalitan nito ang konsepto ng multi-threading na ang Intel ay mabigat na nagpo-promote, at sa katunayan ay tunog ng tulad ng modular na pamamaraan ng AMD na ginamit sa kasalukuyang desktop at server chips. (Intel, gayunpaman, ay umalis sa paraan upang ipaliwanag na hindi ito ang parehong bagay; ang mga module ng AMD ay nagbabahagi ng higit pang mga bagay kasama na ang lumulutang na point.) Ang mga module ay maaaring pagsamahin upang isama hanggang sa walong mga cores.
Para sa pagkonsumo ng kuryente, sinabi ng Intel na ang bagong arkitektura ay nagbibigay-daan sa isang mas malawak na dinamikong hanay ng kuryente, at pinapayagan ang bawat pangunahing sarili nitong independiyenteng dalas at pamamahala ng kapangyarihan, sa gayon pinapayagan ang bawat pataas na pataas sa pagganap at pagguhit ng kapangyarihan. (Paghahambing sa mga mobile processors, ito ay katulad ng ginagamit ng Qualcomm sa mga Krait cores kaysa sa mas karaniwang pamantayang ARM big.LITTLE.) Dinisenyo din ito sa pinahusay na pamamahala ng kapangyarihan at mas mabilis na pagpasok at paglabas mula sa mga mode ng standby, mga tampok na partikular na mahalaga sa mobile market.
Sinabi ng kumpanya na maaari itong mas mahusay na ayusin ang kapangyarihan sa pagitan ng core ng CPU at iba pang mga elemento tulad ng mga graphics, na nagpapahintulot para sa isang mas sopistikadong pagpapatupad ng mode ng pagsabog.
Sa pangkalahatan, sinabi ng Intel na ang bagong arkitektura at isang paglipat sa proseso ng 22nm FinFet SoC ng kompanya ay dapat pahintulutan ang mga chips na nag-aalok ng hanggang sa tatlong beses na mas mataas na pagganap o limang beses na mas mababang kapangyarihan kaysa sa kasalukuyang mga chips ng Atom. Sa pangkalahatan, sinabi ng Intel na ang "mahusay" na dual-core ay maaaring magbalangkas ng isang hindi mahusay na kasalukuyang quad-core processor sa ilalim ng mga hadlang sa kuryente. (Muli, tulad ng lagi, hihintayin ko ang mga produkto na husgahan ito.)
Tulad ng kasalukuyang linya ng Atom, ang arkitektura ng Silvermont ay malamang na magamit sa iba't ibang mga processors, mula sa mga naglalayong mga mobile device hanggang sa mas malalaking mga system. Dapat itong isama ang Avoton, na naglalayong sa mga micro-server, Rangely na naglalayong mga aparato sa network, ang Merrifield na naglalayong sa mga smartphone, at Bay Trail na naglalayong sa mga tablet at convertibles. Sa mga ito, ang pinakahihintay na mataas ay ang platform ng 22nm Bay Trail, na inaasahan ng Intel na magkaroon sa merkado sa oras para sa mga tablet na magagamit ng kapaskuhan, na may higit pang mga detalye na paparating.
Sa pangkalahatan, ang arkitektura ng Silvermont ay parang isang malaking hakbang mula sa umiiral na arkitektura ng Atom, at lalo akong na-intriga upang makita kung paano gumaganap ang Bay Trail, batay sa arkitektura na ito. Sa ngayon, nagkaroon ng isang kilalang agwat ng pagganap sa pagitan ng mababang-dulo ng pamilya ng Core at ang mga high-end na Atoms, ngunit ang arkitektura na ito ay mukhang maaaring talagang isara ang puwang.
Konklusyon: Graphics at Power Define Competition
Ang bawat pangunahing processor na nakikita mo ngayon - kung ang isang Intel o AMD chip na naglalayong sa mga desktop o laptop o isang chip na nakabase sa ARM na naglalayong sa mga smartphone at tablet - ay mayroong maraming mga cores ng CPU, karaniwang maraming maramihang mga GPU (maliban sa mga server ng server), at lahat ng uri ng iba pang dalubhasang lohika, para sa mga bagay tulad ng pagproseso ng imahe, pag-encode ng video at pag-decode, at paghawak ng pag-encrypt.
Habang ang proseso ng chip ay nakakakuha ng mas maliit, mas maraming mga transistor ang maaaring isama sa isang solong chip. Ngunit kung aling mga tampok upang maisama (at kung paano pagsamahin ang mga ito) ay nananatiling isang pangunahing pagkakaiba-iba sa mga vendor ng chip, tulad ng ginagawa ng tukoy na disenyo at microarchitecture ng mga chips mismo.
Ang mga anunsyo na ito ay nagpapakita ng mga tradeoff na ginagawa ng Intel at AMD, at dapat itong magkaroon ng malaking implikasyon para sa pag-compute sa susunod na ilang taon.
Para sa mga desktop at laptop, ang Intel ay mukhang hindi lamang sinusubukan na abutin ang AMD na may built-in na pagganap ng graphics sa pamamagitan ng pagdaragdag ng higit pang mga yunit ng pagpapatupad, ngunit sinusubukan ding sumulong sa mga tampok tulad ng naka-embed na DRAM, sinasamantala ang teknolohiyang proseso nito humantong. Ang AMD ay hindi nakaupo pa rin kasama ang mga graphic nito, kaya dapat itong gumawa para sa isang kawili-wiling pagtutugma. Samantala, ang AMD ay nagtutulak nang husto upang mas mahusay na isama ang mga graphics at mga tampok ng CPU, na maaaring magresulta sa isang bagong paraan ng programming; na tumatagal ng mas mahaba, ngunit maaaring maging hindi mapaniniwalaan o kapani-paniwala mahalaga.
Ang labanan sa pagitan ng KaDi ng AMD at ang Haswell ng Intel ay maaaring maging mas kawili-wili kaysa sa kumpetisyon ng Intel-AMD sa huling ilang taon. Tiyak na magpadala muna si Haswell. (Inaasahan kong makakita ng mga system ngayong tag-araw, kumpara sa unang bahagi ng susunod na taon para sa Kaveri.) Muli, higit sa lahat ito ay para sa mga mainstream desktop at notebook. Ang mga manlalaro at mga gumagamit ng workstation ay walang alinlangan na nais na ipares ang alinman sa maliit na tilad na may discrete graphics solution mula sa alinman sa AMD o Nvidia.
Para sa mga tablet at potensyal na kalaunan mga telepono, ang heterogenous system architecture diskarte na AMD at iba pa ay nagtutulak ay maaaring maging mas mahalaga, bagaman muli ito ay tatagal upang makita kung ang mga aplikasyon ay tunay na samantalahin iyon. Ang bagong arkitektura ng Intel ay dapat gawin itong mas mapagkumpitensya sa puwang na ito. Tila isang malaking hakbang ang pasulong ngunit ang mga katunggali nito ay patuloy na gumagalaw din.
Medyo nakaka-curious ako kung ang mga bagay tulad ng platform ng Bay Trail na nakabase sa Silvermont para sa Atom ay aktwal na tumatakbo nang sapat upang nagsisimula itong lumitaw sa higit pang mga mainstream na mga low-end notebook o kahit na mga desktop. Ang mga tablet na nakabase sa Atom ngayon ay nagpapatakbo ng Windows nang makatwiran, at sa mga pagpapabuti maaari itong sapat para sa maraming mga gumagamit ng pangunahing, kahit na kulang ito sa likod ng pagganap ng Haswell o Kaveri (o kasalukuyang Sandy Bridge ng Intel at kasalukuyang RichD ng AMD, para sa bagay).
Dapat itong gumawa para sa isang kapana-panabik na kumpetisyon sa susunod na taon.