BMS-, BUS-, teollisuus-, instrumentointikaapeli.

Kun kevätfestivaali päättyy, DeepSekekin ympäröivä jännitys on edelleen vahva. Äskettäinen loma korosti merkittävää kilpailun tunnetta teknologiateollisuudessa, ja monet keskustelivat ja analysoivat tätä "monni". Piilaakso kokee ennennäkemättömän kriisin tunteen: avoimen lähdekoodin kannattajat ilmaisevat mielipiteensä uudelleen, ja jopa Openai arvioi uudelleen, onko sen suljetun lähdekoodin strategia paras valinta. Alempien laskennallisten kustannusten uusi paradigma on käynnistänyt ketjureaktion sirujättiläisten, kuten Nvidian, keskuudessa, mikä johtaa Yhdysvaltojen osakemarkkinoiden historiassa yhden päivän markkina-arvotappioihin, kun taas valtion virastot tutkivat Deepseekin käyttämien sirujen noudattamista. Kotimaassa Deepseekin merentakaisten sekoitettujen arvostelujen keskellä on poikkeuksellista kasvua. R1 -mallin käynnistämisen jälkeen siihen liittyvä sovellus on havainnut liikenteen lisääntymisen, mikä osoittaa, että sovellusalan kasvu ajaa yleistä AI -ekosysteemiä eteenpäin. Positiivinen näkökohta on, että Deepseek laajentaa sovellusmahdollisuuksia, mikä viittaa siihen, että CHATGPT: hen luottaminen ei ole tulevaisuudessa yhtä kallista. Tämä muutos on heijastunut Openain viimeaikaisessa toiminnassa, mukaan lukien O3-Mini-nimisen päättelymallin tarjoaminen vapaiksi käyttäjille vastauksena Deepseek R1: lle, samoin kuin myöhemmät päivitykset, jotka tekivät O3-mini-yleisön ajatusketjun. Monet merentakaiset käyttäjät ilmaisivat kiitoksen Deepseekistä näille kehitykselle, vaikka tämä ajatusketju toimii yhteenvedona.
Optimistisesti on selvää, että Deepseek yhdistää kotimaisia toimijoita. Kun se keskittyy koulutuskustannusten vähentämiseen, erilaiset ylävirran siruvalmistajat, keskipilvipalvelujen tarjoajat ja lukuisat startup -yritykset liittyvät aktiivisesti ekosysteemiin, mikä parantaa kustannustehokkuutta Deepseek -mallin käyttämiseen. Deepseekin paperien mukaan V3 -mallin täydellinen koulutus vaatii vain 2,788 miljoonaa H800 GPU -tuntia, ja koulutusprosessi on erittäin vakaa. MOE (asiantuntijoiden seos) arkkitehtuuri on ratkaisevan tärkeä vähentämisessä ennen harjoittelukustannuksia kertoimella kymmenen verrattuna LLAMA 3: een 405 miljardilla parametrilla. Tällä hetkellä V3 on ensimmäinen julkisesti tunnustettu malli, joka osoittaa niin suuren harvinaisuuden Moessa. Lisäksi MLA (monikerroksinen huomio) toimii synergistisesti, etenkin päättelyinä. "Mitä harvempaa moe, sitä suurempi eräkoko tarvitaan päättelyn aikana laskennallisen voiman hyödyntämiseksi täysin, KVCACHE: n koko on keskeinen rajoittava tekijä; MLA vähentää merkittävästi KVCACHE -kokoa", totesi Chuanjing -tekniikan tutkija AI -tekniikan tarkistuksen analysoinnissa. Kaiken kaikkiaan Deepekekin menestys on erilaisten tekniikoiden, ei vain yhden, yhdistelmä. Teollisuuden sisäpiiriläiset ylistävät Deepseek -tiimin tekniikan kykyjä huomauttaen heidän huippuosaamisensa rinnakkaiskoulutuksessa ja operaattorin optimoinnissa saavuttaen uraauurtavat tulokset tarkentamalla kaikkia yksityiskohtia. Deepseekin avoimen lähdekoodin lähestymistapa polttaa edelleen suurten mallien yleistä kehitystä, ja odotetaan, että jos samanlaiset mallit laajenevat kuviin, videoiksi ja muihin, tämä stimuloi merkittävästi kysyntää koko teollisuudessa.
Mahdollisuudet kolmansien osapuolten päättelypalveluihin
Tiedot osoittavat, että julkaisunsa jälkeen Deepseek on kerännyt 22,15 miljoonaa päivittäistä aktiivista käyttäjää (DAU) vain 21 päivän kuluessa saavuttaen 41,6% ChatgPT: n käyttäjäkunnasta ja ylittäen 16,95 miljoonaa päivittäistä aktiivista käyttäjää Doubaon, mikä on niin nopeimmin kasvava sovellus maailmanlaajuisesti, täydentäen Apple App -kauppaa 157 maassa/alueella. Vaikka käyttäjät parvesivat drovesissa, kyberhakkerit ovat kuitenkin hyökänneet Deepseek -sovellukseen säälimättömästi aiheuttaen palvelimille merkittävää rasitusta. Teollisuuden analyytikot uskovat, että tämä johtuu osittain Deepseekin, joka käyttää kortteja koulutukseen, vaikka puuttuu riittävä laskennallinen voima päättelyyn. Teollisuuden sisäpiirin tietoinen AI -teknologiakatsaus: "Useiden palvelinkysymykset voidaan ratkaista helposti veloittamalla maksuja tai rahoitusta ostaa lisää koneita; viime kädessä se riippuu Deepseekin päätöksistä." Tämä on kompromissi keskittymisessä tekniikkaan verrattuna tuotantoon. DeepSeek on suurelta osin luottanut itsekelveen kvantiumin kvantisointiin, koska se on saanut vähän ulkoista rahoitusta, mikä johtaa suhteellisen alhaiseen kassavirtapaineeseen ja puhtaampaan tekniseen ympäristöön. Tällä hetkellä edellä mainittujen ongelmien valossa jotkut käyttäjät kehottavat syvyyttä sosiaalisessa mediassa nostamaan käyttökynnysarvoja tai ottamaan käyttöön maksettuja ominaisuuksia käyttäjän mukavuuden parantamiseksi. Lisäksi kehittäjät ovat alkaneet käyttää virallisia sovellusliittymiä tai kolmansien osapuolien sovellusliittymiä optimointia varten. Deepseekin avoin alusta ilmoitti kuitenkin äskettäin: "Nykyiset palvelinresurssit ovat vähäisiä, ja API -palvelun lataukset on keskeytetty."
Tämä avaa epäilemättä lisää mahdollisuuksia kolmansien osapuolien myyjille AI-infrastruktuurialalla. Äskettäin lukuisat kotimaiset ja kansainväliset pilvi jättiläiset ovat käynnistäneet Deepseekin mallisovellusliittymät - Overseas -jättiläiset Microsoft ja Amazon olivat ensimmäisten joukossa, jotka liittyivät tammikuun lopussa. Kotimainen johtaja Huawei Cloud teki ensimmäisen siirron vapauttaen Deepseek R1: n ja V3: n päättelypalvelut yhteistyössä Piilipohjaisen virtauksen kanssa 1. helmikuuta. AI-teknologiakatsauksen raportit osoittavat, että Piilipohjaisen virtauksen palvelut ovat nähneet käyttäjien virtauksen tehokkaasti "kaatumisen" alustan. Kolme suurta teknologiayritystä-Bat (Baidu, Alibaba, Tencent) ja Bydance-julkaisivat myös edulliset, rajoitetun ajan tarjoukset, jotka alkavat 3. helmikuuta, muistuttaen viime vuoden pilvimyyjän hintasotaa, jonka sytyttivät Deepeken V2-mallin lanseeraukset, joissa Deepseek alkoi kopioida "Price Butcher". " Pilvimyyjien kiihkeät toimet toistavat aikaisemmat vahvat siteet Microsoft Azuren ja Openai: n välillä, joissa Microsoft teki vuonna 2019 huomattavan miljardin dollarin sijoituksen OpenAI: iin ja hyödynsi etuja sen jälkeen, kun ChatgPT: n julkaistiin vuonna 2023. Tämä läheinen suhde alkoi kuitenkin hylätä Meta Open-Sourced -laaman sallimalla muut myyjät. Tässä tapauksessa Deepseek ei ole vain ylittänyt ChatgPT: n tuotesämmön suhteen, vaan se on myös ottanut käyttöön avoimen lähdekoodin malleja O1-julkaisun jälkeen, samanlainen kuin LLAMA: n GPT-3: n herättäminen ympäröivä jännitys.
Todellisuudessa pilvipalveluntarjoajat asettavat itsensä myös liikenneyhdyskäytäviksi AI -sovelluksille, mikä tarkoittaa, että syventävät siteet kehittäjiin tarkoittaa ennaltaehkäiseviä etuja. Raportit osoittavat, että Baidu Smart Cloudilla oli yli 15 000 asiakasta, jotka käyttivät Deepseek -mallia Qianfan -alustan kautta mallin lanseerauspäivänä. Lisäksi useat pienemmät yritykset tarjoavat ratkaisuja, mukaan lukien piipohjainen virtaus, Luchen-tekniikka, Chuanjing-tekniikka ja erilaiset AI-infra-tarjoajat, jotka ovat tukeneet Deepseek-malleille. AI Technology Review on oppinut, että nykyiset optimointimahdollisuudet paikallisille Deepseek -käyttöönottoille on pääasiassa kahdella alueella: yksi optimoi MoE -mallin harvinaisuusominaisuudet käyttämällä sekoitettua päättelytapaa 671 miljardin parametrin MOE -mallin käyttöönottamiseksi paikallisesti käytettäessä hybridi GPU/CPU -päätelmiä. Lisäksi MLA: n optimointi on elintärkeää. Deepekin kahdella mallilla on kuitenkin edelleen joitain haasteita käyttöönoton optimoinnissa. "Mallin koon ja lukuisten parametrien vuoksi optimointi on todella monimutkaista, etenkin paikallisille käyttöönottoille, joissa optimaalisen tasapainon saavuttaminen suorituskyvyn ja kustannusten välillä on haastava", totesi Chuanjing -tekniikan tutkija. Merkittävin este on muistikapasiteetin rajoitusten voittaminen. "Hyväksymme heterogeenisen yhteistyön lähestymistavan prosessorin ja muiden laskennallisten resurssien hyödyntämiseksi kokonaan, asettamalla vain CPU/DRAM: n harvan MOE-matriisin jakamattomat osat korkean suorituskyvyn suorittimen operaattoreiden käyttämiseen, kun taas tiheät osat pysyvät GPU: lla", hän selitti edelleen. Raportit osoittavat, että Chuanjingin avoimen lähdekoodin kehys ktransformerit injektoivat ensisijaisesti erilaisia strategioita ja operaattoreita alkuperäiseen muuntajien toteutukseen mallin kautta, mikä parantaa merkittävästi päätelmänopeutta käyttämällä menetelmiä, kuten Cudagraph. Deepseek on luonut mahdollisuuksia näille startup -yrityksille, koska kasvuhyödyt ovat ilmeisiä; Monet yritykset ovat ilmoittaneet huomattavan asiakaskasvun DeepSeek -sovellusliittymän käynnistämisen jälkeen, ja he ovat saaneet tiedusteluja aiemmilta asiakkailta, jotka etsivät optimointia. Teollisuuden sisäpiiriläiset ovat todenneet: "Aikaisemmin jonkin verran vakiintuneita asiakasryhmiä lukittiin usein suurempien yritysten standardisoituihin palveluihin, jotka olivat tiiviisti sidoksissa skaalauksen aiheuttamien kustannusten eduista. Kuitenkin valmistuttuaan Deepseek-R1/V3: n käyttöönottoa ennen kevään festivaalia saimme yhtäkkiä yhteistyöpyyntöjä useilta tunnetuilta asiakkailta, ja jopa aikaisemmin upotettuja asiakkaita aloittivat kontaktin syvän palvelumme." Tällä hetkellä näyttää siltä, että DeepSeek tekee mallin päätelmän suorituskyvystä yhä kriittisemmäksi, ja suurten mallejen laajemman käyttöönoton myötä tämä vaikuttaa edelleen AI Infra -teollisuudessa merkittävästi. Jos Deepekek-tason malli voitaisiin käyttää paikallisesti edullisilla kustannuksilla, se auttaisi huomattavasti hallituksen ja yrityksen digitaalimuutospyrkimyksiä. Haasteet kuitenkin jatkuvat, koska joillakin asiakkailla voi olla suuria odotuksia suurista mallimahdollisuuksista, mikä tekee selvemmäksi, että suorituskyvyn ja kustannusten tasapainottaminen tulee elintärkeitä käytännön käyttöönotossa.
Arvioidakseen, onko Deepseek parempi kuin chatgpt, on välttämätöntä ymmärtää heidän keskeiset erot, vahvuudet ja käyttötapaukset. Tässä on kattava vertailu:
Ominaisuus | Syvään | Chatgpt |
---|---|---|
Omistusoikeus | Kiinalainen yritys | Kehittänyt Openai |
Lähdemalli | Avoimen lähdekoodin | Omistus- |
Maksaa | Vapaasti käyttää; halvemmat API -käyttövaihtoehdot | Tilaus tai maksukäyttöinen hinnoittelu |
Räätälöinti | Erittäin muokattavissa, jolloin käyttäjät voivat säätää ja rakentaa sitä | Rajoitettu räätälöinti käytettävissä |
Suorituskyky tietyissä tehtävissä | Excels tietyillä alueilla, kuten data -analytiikka ja tiedonhaku | Monipuolinen ja vahva suorituskyky luovassa kirjoittamisessa ja keskustelutehtävissä |
Kielituki | Voimakas keskittyminen kiinan kieleen ja kulttuuriin | Laaja kielituki, mutta Yhdysvaltain keskus |
Koulutuskustannukset | Alhaisemmat koulutuskustannukset, optimoitu tehokkuuteen | Korkeammat koulutuskustannukset vaativat huomattavia laskennallisia resursseja |
Vasteen vaihtelu | Voi tarjota erilaisia vastauksia, joihin geopoliittinen konteksti mahdollisesti vaikuttaa | Johdonmukaiset vastaukset koulutustietojen perusteella |
Kohdeyleisö | Kehittäjille ja joustavuutta haluaville tutkijoille suunnattu tutkijoille | Pyrkivät yleisiin käyttäjiin, jotka etsivät keskusteluominaisuuksia |
Käyttötapaukset | Tehokkaampi koodin luomiseen ja nopeaan tehtäviin | Ihanteellinen tekstin luomiseen, kyselyihin vastaamiseen ja vuoropuhelun harjoittamiseen |
Kriittinen näkökulma "NVIDIA: n häiritsemiseen"
Tällä hetkellä Huawein lisäksi useat kotimaiset siruvalmistajat, kuten Moore -säikeet, Muxi, Biran Technology ja Tianxu Zhixin, mukautuvat myös Deepseekin kahteen malliin. Sirunvalmistaja kertoi AI -teknologiakatsauksesta: "Deepseekin rakenne osoittaa innovaatiota, mutta se on edelleen LLM. Sopeutumisemme Deepseekiin keskittyy ensisijaisesti perustelujen sovelluksiin, mikä tekee teknisestä toteutuksesta melko suoraviivaisen ja nopean." MOE: n lähestymistapa vaatii kuitenkin korkeampia vaatimuksia varastoinnin ja jakelun suhteen yhdessä yhteensopivuuden varmistamisen kanssa, kun otetaan käyttöön kotimaisten sirujen kanssa, ja esitetään lukuisia tekniikan haasteita, jotka tarvitsevat ratkaisua sopeutumisen aikana. "Tällä hetkellä kotimainen laskennallinen voima ei vastaa NVIDIA: ta käytettävyydessä ja vakaudessa, mikä vaatii alkuperäisen tehtaan osallistumista ohjelmistoympäristön asetukseen, vianetsinnän ja perustavanlaatuisen suorituskyvyn optimointiin", alan ammattilainen sanoi käytännön kokemuksen perusteella. Samanaikaisesti "Deepseek R1: n suuren parametri -asteikon vuoksi kotimainen laskennallinen voima vaatii enemmän solmuja rinnakkaistamiseksi. Lisäksi kotimaiset laitteistomääritykset ovat edelleen jonkin verran takana; esimerkiksi Huawei 910B ei tällä hetkellä voi tukea Deepseekin esittämiä FP8 -päätelmiä." Yksi Deepseek V3 -mallin kohokohdista on FP8: n sekoitetun tarkkuusharjoittelukehyksen käyttöönotto, joka on validoitu tehokkaasti erittäin suureen malliin, mikä merkitsee merkittävää saavutusta. Aikaisemmin tärkeimmät toimijat, kuten Microsoft ja Nvidia, ehdottivat siihen liittyvää työtä, mutta epäilykset viipyvät teollisuudessa toteutettavuuden suhteen. On ymmärrettävä, että verrattuna INT8: een, FP8: n ensisijainen etu on, että koulutuksen jälkeinen kvantisointi voi saavuttaa melkein häviöttömän tarkkuuden parantaen merkittävästi päätelmänopeutta. Verrattuna FP16: een FP8 voi toteuttaa jopa kaksi kertaa kiihtyvyyden NVIDIA: n H20: lla ja yli 1,5 -kertaisesti kiihtyvyydellä H100: lla. Erityisesti, koska kotimaisen laskennallisen voiman ja kotimaisten mallien kehitystä koskevat keskustelut saavat vauhtia, spekulointia siitä, voisiko NVIDIA häiritä ja voidaanko CUDA -vallihauta ohittaa, on yhä yleisempi. Yksi kiistaton tosiasia on, että Deepseek on todellakin aiheuttanut Nvidian markkina-arvon huomattavan laskun, mutta tämä muutos herättää kysymyksiä Nvidian huippuluokan laskennallisen voiman eheyttä. Aikaisemmin hyväksyttyjä kertomuksia, jotka koskevat pääomapohjaista laskennallista kertymistä, haastetaan, mutta Nvidian on edelleen vaikea korvata kokonaan koulutuskkenaarioissa. Deepseekin CUDA: n syvän käytön analyysi osoittaa, että joustavuus - kuten SM: n käyttäminen viestinnässä tai verkkokorttien suoraan manipuloinnissa - ei ole mahdollista tavallisille GPU: ille. Teollisuuden näkökulmat korostavat, että Nvidian vallihauta kattaa koko CUDA -ekosysteemin pikemminkin kuin pelkästään CUDA: n ja PTX (rinnakkaiskierteiden suorittamisen) ohjeet, joita Deepseek käyttää edelleen osa CUDA -ekosysteemiä. "Lyhyellä aikavälillä NVIDIA: n laskennallista voimaa ei voida ohittaa - tämä on erityisen selkeä koulutuksessa; kotimaisten korttien ottaminen päättelyyn on suhteellisen helpompaa, joten edistyminen on todennäköisesti nopeampaa. Kotimaisten korttien mukauttaminen keskittyy pääasiassa päätelmiin; kukaan ei ole vielä onnistunut kouluttamaan Deepekeekin suorituskykyä kotimaisissa korteissa laajuudessa", teollisuusanalyysi, jonka mukaan AI -tekniikan tekniikka -tutkimus. Kaiken kaikkiaan päätelmän kannalta olosuhteet ovat rohkaisevia kotimaisten suurten mallilastujen suhteen. Kotimaisten siruvalmistajien mahdollisuudet päätelmän alueella ovat ilmeisempiä koulutuksen liian suurten vaatimusten vuoksi, mikä estää pääsyä. Analyytikot väittävät, että vain kotimaisten päätelmäkorttien hyödyntäminen riittää; Lisäkoneen hankkiminen on tarvittaessa toteutettavissa, kun taas koulutusmallit asettavat ainutlaatuisia haasteita - lisääntyneen määrän koneita voi tulla rasittavaksi, ja korkeammat virhesuhteet voivat vaikuttaa negatiivisesti harjoittelutuloksiin. Koulutuksella on myös erityisiä klusterin asteikkovaatimuksia, kun taas päätelmien klusterien vaatimukset eivät ole yhtä tiukkoja, mikä helpottaa GPU -vaatimuksia. Tällä hetkellä Nvidian yhden H20 -kortin suorituskyky ei ylitä Huawei tai Cambrian; Sen vahvuus on klusteroinnissa. Laskennallisten energiamarkkinoiden kokonaisvaikutuksen perusteella Luchen Technology -yrityksen perustaja, Yang, huomautti AI Technology Review -haastattelussa, "Deepseek voi väliaikaisesti heikentää erittäin suuria koulutuksen laskennallisia klustereita ja vuokrausta vähentämällä huomattavasti suuria mallisarjoitteluun liittyviä kustannuksia, päättelyä ja sovelluksia, joita jatkuvat, markkinat ovat todennäköisesti aloittaneet AI: n perustumisen aloittamisen. Kysyntä laskennallisilla sähkömarkkinoilla. " Lisäksi "Deepseekin kohonnut päättely- ja hienosäätöpalvelujen kysyntä on yhteensopivampaa kotimaisen laskennallisen maiseman kanssa, jossa paikalliset kapasiteetit ovat suhteellisen heikkoja, mikä auttaa vähentämään käyttämättömien resurssien jätteiden jälkeisiä jätteitä klusterin jälkeisistä laitoksista; tämä luo toteuttamiskelpoisia mahdollisuuksia valmistajille kotimaisen laskennallisen ekosysteemin eri tasoilla." Luchen Technology on tehnyt yhteistyötä Huawei Cloudin kanssa Deepseek R1 -sarjan perustussovellusliittymien ja pilvikuvauspalvelujen käynnistämiseksi kotimaiseen laskennalliseen voimaan. Yang ilmaisi optimismin tulevaisuudesta: "Deepseek herättää luottamusta kotimaassa tuotettuihin ratkaisuihin, rohkaisemalla entistä innostusta ja investointeja kotimaan laskennallisiin ominaisuuksiin."

Johtopäätös
Onko Deepseek "parempi" kuin chatgpt, riippuu käyttäjän erityistarpeista ja tavoitteista. Tehtäviä, jotka tarvitsevat joustavuutta, alhaisia kustannuksia ja räätälöintiä, Deepseek voi olla parempi. Luovaa kirjoittamista, yleistä kyselyä ja käyttäjäystävällisiä keskusteluliittymiä varten ChatgPT voi ottaa johtoaseman. Jokainen työkalu palvelee erilaisia tarkoituksia, joten valinta riippuu suuresti tilanteesta, jossa niitä käytetään.
Ohjauskaapelit
Jäsennelty kaapelointijärjestelmä
Verkko ja data, kuituoptinen kaapeli, laastarijohto, moduulit, etulevy
16. huhtikuuta-18. huhtikuuta 2024 Keski-energia Dubaissa
16. huhtikuuta-18. huhtikuuta 2024 Securika Moskovassa
Toukokuu 9., 2024 Uusia tuotteita ja teknologioita lanseeratapahtuma Shanghaissa
22. lokakuuta 25., 2024 Turvallisuus Kiina Pekingissä
19.-20. Marraskuuta 2024 Connected World KSA
Viestin aika: helmikuu-10-2025