NOR eller NAND flash?

Eller: Hvorfor utviklere av innvevde systemer vurderer seriell NAND Flash for lagring av kode i systemer med kunstig intelligens.  

Publisert Sist oppdatert

Denne artikkelen er 2 år eller eldre

Potensialet for innovasjon som er skapt av kunstig intelligens (AI) engasjerer innvevd-utviklere i alle markedssektorer. Faktisk kan det virke rart å tenke på «innovasjon», siden den grunnleggende AI-teknologien ikke i seg selv er ny: IBMs Deep Blue AI-system slo sjakkverdensmester Garry Kasparov allerede i 1997.

Kunstig intelligens

Men i to tiår etter dette tidlige gjennombruddet gikk det sakte med å introdusere AI-teknologier. Det var først på slutten av 2010-tallet at ting endret seg slik at kunstig intelligens kom inn i den generelle utviklingen av innvevde systemer, spesielt hjulpet av to faktorer: For det første tilgjengeligheten av store treningsdatasett, generert av sensorrike IoT-systemer. Store samlinger av merkede bilder, video og andre former for data er også tilgjengelig for første gang, grunnet populariteten til plattformer som YouTube, Instagram, Snapchat og Facebook Live.

Kritisk kapasitet

For det andre har kapasiteten til innvevde systemers arbeidshester – enheter som applikasjonsprosessorer, SoC eller FPGA – nådd det kritiske punktet der de er i stand til å fungere som «inferensmotorer». Dette betyr at de kan kjøre maskinlæringsalgoritmene som gjør det mulig for et elektronisk system å dekode en fil med piksler og gjenkjenne et objekt som en katt eller en hund.

AI og innvevde systemer

AI-teknologi står foran en rask implementering i innvevde systemer: Analytikervirksomheten IDC forventer at markedet for AI-optimaliserte prosessorer for kantprosesseringssystemer vil vokse med en samlet årlig hastighet på 65% frem til 2023. Men denne utviklingen mot å ta i bruk AI reiser også spørsmål om bærekraften i innvevde utvikleres nåværende tilnærming når det gjelder å ivareta minne til kodelagring.

SPI NOR flash

I dag er SPI NOR Flash den foretrukne minnetypen for lagring av oppstarts- og applikasjonskode i innvevde systemer. Men SPI NOR knaker under presset for å gi høyere minnekapasitet med tanke på å imøtekomme de større kodebasene som nye AI-applikasjoner genererer. Dagens programvarerike innvevde systemer har også en tendens til å kreve regelmessige oppdateringer i felt, for å implementere sikkerhetsoppdateringer og for å legge til egenskaper, en funksjon som setter Programmér/Slett-ytelsen til SPI NOR Flash i søkelyset.

Hvorfor ikke NAND flash?

Denne artikkelen foreslår at utviklere av innvevde systemer skal åpne sinnet for potensielle fordeler ved å erstatte SPI NOR Flash med seriell NAND Flash for lagring av oppgavekritisk oppstarts- og applikasjonskode, og å revurdere deres antagelser om påliteligheten, levetiden og ytelsen til NAND.

Skaleringsproblemet til NOR Flash

SPI NOR Flash har rettmessig fortjent sitt rykte for å ivareta pålitelig kodelagring. NOR Flash-teknologien er av natur robust, sikrer signalintegritet fra ende-til-ende og støtter dataoppbevaring over en minimumsperiode på 100.000 timer.

Winbond, som er verdens største produsent av SPI NOR Flash i volum og verdi ifølge 2018-data fra  markedsanalytikerne i Web Feet Research, leverer diskrete SPI NOR Flash komponenter i størrelser som starter på 512Kbits for en 3,0 V kraftforsyning, og 1Mbit for en 1,8 V forsyning. I størrelser opp til 2Gbits tilbyr SPI NOR Flash en konkurransedyktig kostnad per bit.  Men oppskaleringen (dvs. prosesskrympingen i produksjon) implisert av Moores Lov har avtatt dramatisk innen NOR Flash teknologi: Winbonds avanserte NOR Flash silisiumskiver produseres i dag i en 58nm prosess. Utviklingsprognosene antyder en ny krymping til omkring 45nm i løpet av få år.

Moores lov og kostnad per bit

Og dette skaper et problem for de mange innvevd-utviklerne som begynner å implementere AI-teknologi: Applikasjoner slik som maskinlæring genererer kompleks programvarekode. I økende grad vil utviklere kreve kodelagring på 1 Gbit eller mer - en størrelse der kostnaden per bit for SPI NOR Flash blir lite attraktiv sammenlignet med seriell NAND Flash. Dette er fordi seriell NAND Flash, i motsetning til SPI NOR, i stor grad fulgte Moores lov ved prosessnoder på 46 nm, 32 nm, 2x nm og 1x nm. Nylig har utviklingen av 3D NAND-strukturer gjort det mulig for produsenter av hyllevare NAND Flash å fortsette å øke minnetettheten ved 1x nm noder.

NAND billigere

Siden det i silisiumverdenen er en veldig nær sammenheng mellom brikkeområdet og komponentkostnadene, gjør de mindre prosessnodene som seriell NAND kan fremstilles ved det vesentlig billigere enn SPI NOR ved høye tettheter på 1Gbit og over.

Trådløs oppdatering

Dagens smarte, tilkoblede enheter krever også oppdateringer på stedet og ofte vis luft (OTA) for å implementere sikkerhetsoppdateringer og funksjonsoppgraderinger. Også her er SPI NOR en ulempe. I et typisk eksempel på OTA-oppdateringsoperasjon overskriver den nye koden den eksisterende koden i Flash-matrisen, noe som betyr at systemet kanskje må slås av mens oppdateringen skjer. For å minimere nedetid, vil utvikleren ønske å installere oppdateringen så raskt som mulig.

De kritiske parametrene for oppdateringsytelse i dette scenariet er derfor programmeringstid og slettetid - funksjoner der seriell NAND også utkonkurrerer SPI NOR.

NAND Flash’ problematiske rykte

Til tross for kostnads- og ytelsesfordelene med seriell NAND Flash i programvaretunge, innvevde AI-applikasjoner, krever beslutningen om å velge seriell NAND for lagring av oppstarts- og applikasjonskode en endring i tankegang innen innvevd-miljøet. Det er på grunn av forestillinger om all seriell NAND Flash, som er basert på bruken av NAND utelukkende med ultrahøy tetthet.

Ofrer integritet og varighet

På en bærbar datamaskins- eller nettbrettets Solid-State Disk (SSD) er produsentene forberedt på å ofre dataintegritet og datavarighet for å få høy kapasitet og svært lave kostnader per bit, ved å bruke de nyeste 3D-flerlagscelleteknologiene. I virkeligheten er korrupsjon eller tap over tid av noen få bits fra en brukers musikk- eller videofil et akseptabelt kompromiss til fordel for ultra-lavkostminne produsert i den nyeste 1xnm prosessnoden.

Fig. 1: Tidligere har SPI NOR tilbudt raskere lesehastigheter enn seriell NAND. (Illustrasjon: Winbond)

Men seriell NAND Flash som er optimalisert for kodelagring, fungerer veldig annerledes enn denne avanserte/ultra-lavkost NAND-typen. 

Seriell NAND for ytelse og pålitelighet

For å ivareta en migrasjonsvei fra SPI NOR til seriell NAND Flash for kodelagring i AI-applikasjoner, har Winbond raffinert sin fabrikasjonsprosess for seriell NAND og det serielle grensesnittet for å kunne tilby:

Fig. 2: Winbonds doble QspiNAND tilbyr en maksimal lesehastighet på 166MB/s. (Illustrasjon: Winbond)
  • Rask leseytelse
  • Rask programmerings-/sletteytelse
  • Like-for-like kompatibilitet med SPI NOR
  • Høy signalintegritet og lang datavarighet

Den høye påliteligheten til Winbond QspiNAND (Quad SPI NAND) Flash har utgangspunkt i fabrikasjonsprosessen: Dette er såkalt Single-Level Cell (SLC) Flash produsert i en 46nm prosess, omkring tre generasjoner eldre enn den 1x nm 3D Multi-Level Cell (MLC) Flash teknologien som benyttes i forbruker-SSDer. Påliteligheten og kvaliteten til denne eldre prosessen er blitt prøvd over mange år med bruk i felten. De større kretsegenskapene til den 46nm prosessen gir også rikelig takhøyde for å tillate elektronlekkasje uten å kompromittere dataholdbarheten: Winbond QspiNAND Flash er spesifisert for datavarighet på 100.000 timer i det oppgitte driftstemperaturområdet.

Brytningspunkt

Men ved 46nm, er seriell NAND brikkeareal-per-bit og dermed kostnad-per-bit betydelig mindre enn for SPI NOR fabrikkert ved 58nm: Derfor kostnad-per-bit for seriell NAND være så lav som halvparten av kostnaden for SPI NOR ved størrelser på 1Gbit og mer.

I tillegg ivaretar innebygd feilkorrigeringskode (ECC) dataintegriteten både under skrive- og leseoperasjoner. Den 1-bit ECC metoden som er implementert i Winbond QspiNAND Flash støttes enkelt av en hvilken som helst SoC, applikasjonsprosessor eller annen kantprosesseringsplattform.

Ytelsesforbedringer i andre-generasjon seriell NAND

Nå har utvikling av ny Winbond grensesnittsteknologi (QSPI-NAND) i den nyeste generasjonen av serielle NAND Flash-komponenter gitt den en ytelses- såvel som en kostnadsfordel i forhold til SPI NOR i innvevde AI-baserte applikasjoner.

Latens, eller forsinkelse, er en viktig ytelsesparameter i AI-systemer. En inferensmotor som implementerer en maskinlæringsalgoritme lokalt, må utføre enormt komplekse databehandlinger, ofte i løpet av millisekunder. Dette krever rask dataavlesning.

Den første generasjonen av 104 MHz QspiNAND Flash fra Winbond oppnådde en maksimal lesekapasitet på 50 MB/s i kontinuerlig lesemodus. Til sammenligning tilbyr 133 MHz Quad SpiNOR Flash maksimal kapasitet på 80 MB/s (se figur 1). 

Nå har Winbond introdusert den andre generasjons W25Nxx JW QspiNAND-serien av enheter som støtter en høyere klokkehastighet i STR- (single transfer rate) modus på 166MHz (83MHz i dobbel overføringshastighetsmodus), for en maksimal lesekapasitet på 83MB/s. Denne kapasiteten kan dobles til 166MB/s ved bruk av W72N-serien med doble QspiNAND Flash-produkter, som er satt sammen av to silisiumbrikker i en enkelt pakke for å gi 8 I/O i en dobbel x4-konfigurasjon.

Nyskapende styringsprogramvare gjør vertskontrolleren i stand til å operere en W72N via en enkelt Chip Select kommando (se Figur 2).

Reduserer latens i AI-systemer

Denne hurtige leseytelsen resulterer i lave forsinkelser i AI-systemer. Den høye ytelsen til Winbond QspiNAND Flash støtter også raske OTA oppdateringsfunksjoner for å kunne redusere nedetid. Kapasiteten i programmeringsmodus for den nye 1Gbit W25N01JW QspiNAND er 8,5 MB/s, sammenlignet med 0,36 MB/s for den 256Mbit W25H256JV, et Winbond SpiNOR Flash-produkt. Slettetid for en 128 Kbit blokk er 2ms for QspiNAND-produktet, sammenlignet med 150 ms for en 64Kbit blokk i SpiNOR-produktet.

Total programmeringstid for 1Gbit med data er nesten seks minutter – 356 sekunder – for SpiNOR-komponenten, mot kun 15 sekunder for den andre-generasjons QspiNAND-komponenten.

Enkel å integrere i innvevde systemer

Overgangen til å integrere AI-funksjoner i innvevde systemer gir OEM-er dermed en god grunn til å evaluere seriell NAND Flash som erstatning for mer kostbare SPI NOR ved tettheter på 1Gbit og høyere. Implementeringen av seriell NAND i Winbonds andre generasjons QspiNAND-produkter letter denne overgangen, ikke bare når det gjelder enkel 1-bits ECC, men også i driften av selve QspiNAND-grensesnittet: Den er programvarekompatibel med det velkjente SPI NOR-grensesnittet , og krever bare implementering av fem nye kommandoer for å styre ECC og Look-Up Table (LUT) -funksjoner som er spesifikke for NAND Flash-teknologi.

I tillegg leveres QspiNAND-enheter som 1Gbit W25N01JW i industristandard fotavtrykk og pinneutlegg, slik at de kan brukes som direkte erstatning for SPI NOR Flash-komponenter i eksisterende design.

Omfattende økosystem

Og integrering av denne avanserte, pålitelige NAND-teknologien i innvevde systemer blir ytterligere tilrettelagt av økosystemet til SoC-leverandører som støtter det, inkludert NXP Semiconductors, STMicroelectronics og Renesas. NXP har for eksempel bygget et Winbond SpiStack NOR + NAND sampakket enhet inn i utviklingskortet FRWY-LS1012A for kantprosessoren LS1012A. I denne implementeringen lagrer en Winbond QspiNAND-enhet kortets Linux®-operativsystemkode, mens en liten Winbond SpiNOR-brikke lagrer komponentens oppstartskode.

Pålitelig lagring

Andre generasjons QspiNAND Flash-teknologi er tilgjengelig i dag i 1 Gbit størrelse, og er skalerbar til størrelser på 2 Gbits, 4 Gbits og mer. Det gir derfor veikartet som utviklere av innvevde systemer trenger for å garantere pålitelig lagring av de voksende kodebasene der de vil implementere stadig mer sofistikert AI-teknologi i kanten.

Om forfatteren: Syed S. Hussain er markedsdirektør i Winbond Electronics Corporation America.

 

 

 

Powered by Labrador CMS