DeepSeek-R1 yhdistää tekoälyn ja reunalaskennan teolliseen IoT-käyttöön

Johdanto

DeepSeek-R1:n pienikokoiset tislatut mallit hienosäädetään DeepSeek-R1:n tuottaman ajatusketjudatan avulla, ja ne on merkitty...tagit, jotka perivät R1:n päättelykyvyt. Nämä hienosäädetyt tietojoukot sisältävät eksplisiittisesti päättelyprosesseja, kuten ongelman hajotelmaa ja välivaiheen päättelyjä. Vahvistava oppiminen on yhdenmukaistanut tislatun mallin käyttäytymismallit R1:n luomien päättelyvaiheiden kanssa. Tämä tislausmekanismi mahdollistaa pienten mallien laskennallisen tehokkuuden ylläpitämisen samalla, kun ne saavuttavat monimutkaisia ​​päättelykykyjä, jotka ovat lähellä suurempien mallien tasoa, mikä on merkittävää sovellusarvoa resurssirajoitteisissa tilanteissa. Esimerkiksi 14B-versio saavuttaa 92 % alkuperäisen DeepSeek-R1-mallin koodin valmistumisesta. Tässä artikkelissa esitellään DeepSeek-R1:n tislattu malli ja sen ydinsovellukset teollisessa reunalaskennassa, tiivistettynä seuraaviin neljään suuntaan sekä erityisiin toteutustapauksiin:

dc3c637c5helmi8b62ed51b6d83ac0b4

Laitteiden ennakoiva huolto

Tekninen toteutus

Anturifuusio:

Integroi värähtely-, lämpötila- ja virtatiedot PLC:istä Modbus-protokollan kautta (näytteenottotaajuus 1 kHz).

Ominaisuuksien erottaminen:

Suorita Edge Impulse Jetson Orin NX:ssä 128-ulotteisten aikasarjaominaisuuksien poimimiseksi.

Mallin päättely:

Ota käyttöön DeepSeek-R1-Distill-14B-malli ja syötä ominaisuusvektoreita vikatodennäköisyysarvojen luomiseksi.

Dynaaminen säätö:

Käynnistä huoltotyötilaukset, kun luotettavuus on > 85 %, ja käynnistä toinen vahvistusprosessi, kun se on < 60 %.

Asiaankuuluva tapaus

Schneider Electric otti tämän ratkaisun käyttöön kaivoskoneissa, mikä vähensi väärien positiivisten tulosten määrää 63 % ja ylläpitokustannuksia 41 %.

1

DeepSeek R1 -tislatun mallin suorittaminen InHand AI Edge -tietokoneissa

Tehostettu visuaalinen tarkastus

Lähtöarkkitehtuuri

Tyypillinen käyttöönottoprosessi:

kamera = GigE_Vision_Camera(500fps) # Gigabitin teollisuuskamera
frame = camera.capture() # Ota kuva
esikäsitelty = OpenCV.denoise(frame) # Kohinanpoistajan esikäsittely
defect_type = DeepSeek_R1_7B.infer(esikäsitelty) # Vian luokittelu
jos vikatyyppi != 'normaali':
PLC.trigger_reject() # Liipaisimen lajittelumekanismi

Suorituskykymittarit

Käsittelyviive:

82 ms (Jetson AGX Orin)

Tarkkuus:

Ruiskuvaletun järjestelmän virheiden havaitsemisaste on 98,7 %.

2

DeepSeek R1:n vaikutukset: Voittajat ja häviäjät generatiivisen tekoälyn arvoketjussa

Prosessivirran optimointi

Keskeiset teknologiat

Luonnollisen kielen vuorovaikutus:

Käyttäjät kuvailevat laitteiden poikkeavuuksia äänellä (esim. "Ekstruuderin paineenvaihtelu ±0,3 MPa").

Multimodaalinen päättely:

Malli luo optimointiehdotuksia laitteiston historiallisten tietojen perusteella (esim. ruuvin nopeuden säätäminen 2,5 %).

Digitaalisen kaksosen todentaminen:

Parametrisimulaation validointi EdgeX Foundry -alustalla.

Toteutuksen vaikutus

BASF:n kemiantehdas otti käyttöön tämän järjestelmän, ja energiankulutus laski 17 % ja tuotteiden laatu parani 9 %.

3

Edge AI ja liiketoiminnan tulevaisuus: OpenAI o1 vs. DeepSeek R1 terveydenhuollossa, autoteollisuudessa ja IIoT:ssä

Tietokannan välitön haku

Arkkitehtuurisuunnittelu

Paikallinen vektoritietokanta:

Käytä ChromaDB:tä laitekäsikirjojen ja prosessispesifikaatioiden tallentamiseen (upotusulottuvuus 768).

Hybridihaku:

Yhdistä BM25-algoritmi + kosinin samankaltaisuus kyselyä varten.

Tuloksen luominen:

R1-7B-malli tiivistää ja tarkentaa hakutuloksia.

Tyypillinen tapaus

Siemensin insinöörit ratkaisivat invertterin viat luonnollisen kielen kyselyillä, mikä lyhensi keskimääräistä käsittelyaikaa 58 %.

Käyttöönoton haasteet ja ratkaisut

Muistirajoitukset:

Hyödynsi KV-välimuistin kvantisointitekniikkaa, joka vähensi 14B-mallin muistin käyttöä 32 Gt:sta 9 Gt:iin.

Reaaliaikaisen suorituskyvyn varmistaminen:

Vakautettu yksittäisen päättelyn latenssi ±15 millisekuntiin CUDA Graph -optimoinnin avulla.

Mallin ajo:

Viikoittaiset inkrementaaliset päivitykset (lähetetään vain 2 % parametreista).

Äärimmäiset ympäristöt:

Suunniteltu laajalle lämpötila-alueelle -40 °C - 85 °C ja IP67-suojausluokituksella.

5
微信图片_20240614024031.jpg1

Johtopäätös

Nykyiset käyttöönottokustannukset ovat nyt laskeneet 599 dollariin solmua kohden (Jetson Orin NX), ja skaalautuvia sovelluksia on syntymässä esimerkiksi 3C-valmistuksessa, autoteollisuuden kokoonpanossa ja energiakemiassa. MoE-arkkitehtuurin ja kvantisointiteknologian jatkuvan optimoinnin odotetaan mahdollistavan 70B-mallin toiminnan reunakoneissa vuoden 2025 loppuun mennessä.

Etsi ELV-kaapeliratkaisu

Ohjauskaapelit

BMS-, BUS-, teollisuus- ja instrumentointikaapeleille.

Rakenteinen kaapelointijärjestelmä

Verkko ja data, valokuitukaapeli, kytkentäkaapeli, moduulit, etulevy

Vuoden 2024 näyttely- ja tapahtumakatsaus

16.–18. huhtikuuta 2024 Lähi-idän energiamessut Dubaissa

16.–18. huhtikuuta 2024 Securika Moskovassa

9. toukokuuta 2024 UUSIEN TUOTTEIDEN JA TEKNOLOGIOIDEN LANSEERAUSTILAISUUS Shanghaissa

22.–25. lokakuuta 2024 SECURITY CHINA Pekingissä

19.–20. marraskuuta 2024 CONNECTED WORLD Saudi-Arabia


Julkaisun aika: 07.02.2025