Naujas žaidėjas pateko į AI vilą, ir tai sukelia reikšmingų sutrikimų.
Kinijos AI „Deepseek“ praėjusią savaitę sukūrė bangas, kai išleido pilną „R1“ versiją-bendrovės atvirojo kodo pagrindimo modelį, kuris gali aplenkti „Openai“ O1. Pirmadienį „App Store“ atsisiuntimai „Deepseek“ AI asistento, kuris veikia „V3“, gruodžio mėn. Išleistą „Deepseek“, „Deepseek“ – viršijo „ChatGpt“, kuris anksčiau buvo labiausiai atsisiųstas nemokama programa.
Taip pat: Aš išbandžiau „Deepseek“ R1 ir V3 kodavimo įgūdžius – ir mes ne visi pasmerkti (dar)
„Deepseek R1“ taip pat jau pakilo į trečiąją vietą „HuggingFace“ „Chatbot“ arenoje, pagal keletą „Dvynių“ modelių, taip pat „ChatGPT-4o“. Beveik vos, kai jis nugrimzta į „Openai“, „Deepseek“ pradėjo riboti registraciją dėl tariamo kibernetinio išpuolio, o paskui sekė savo didelę „Splash“ su perspektyviu nauju įvaizdžio modeliu.
„Deepseek“ pokalbių puslapis rašymo metu.
Radhika Rajkumar/Zdnet ekrano kopija
Kas yra „Deepseee“?
Kinijos startuolis, įkurtas Liang Wenfeng 2023 m. Gegužės mėn. (Taigi net dvejų metų), Kinijos startuolis metė iššūkį įsteigtoms AI kompanijoms savo atvirojo kodo požiūriu. Anot „Forbes“, „Deepseek“ kraštas gali būti tas, kad jį finansuoja tik „High Flyer“-rizikos draudimo fondas, kurį taip pat valdo „Wenfeng“, kuris įmonei suteikia finansavimo modelį, palaikantį greitą augimą ir tyrimus.
Kas yra „Deepseee R1“?
Visiškai išleista praėjusią savaitę, „R1“ yra „Deepseek“ pavyzdinis samprotavimo modelis, kuris atlieka „Openai“ pagirtą O1 modelį apie keletą matematikos, kodavimo ir samprotavimo etalonų. R1 įdomiausia yra tai, kad, skirtingai nuo kitų geriausių technologijų milžinų modelių, tai yra atviro kodo, tai reiškia, kad kiekvienas gali atsisiųsti ir jį naudoti. Vis dėlto „Deepseek“ neatskleidė R1 mokymo duomenų rinkinio. Iki šiol visi kiti išleisti modeliai taip pat yra atviro kodo.
„Deepseek“ taip pat yra pigesni nei palyginami JAV modeliai. Remiantis nuoroda, „R1 API“ prieiga prasideda nuo 0,14 USD už milijoną žetonų, tai yra dalis 7,50 USD, kurią „Openai“ imasi už lygiavertę pakopą.
Taip pat: Įmonės diegia „greičio apribojimą“ dislokuodami „Gen AI“ – štai kodėl
Bendrovės tiriamojo dokumento „Deepseek“ teigia, kad jo V3 modelis mokyti kainavo 5,6 mln. Kaip pranešė AP, kai kurie laboratorijos ekspertai mano, kad dokumentas reiškia tik paskutinį V3 mokymo, o ne visos jo plėtros išlaidos (tai būtų tik maža dalis to, ką technologijų milžinai išleido kurdami konkurencinius modelius). Kai kurie mano, kad „Deepseek“ išlaidos neapima ankstesnės infrastruktūros, mokslinių tyrimų ir plėtros, duomenų ir personalo išlaidų.
Vienas trūkumas, galintis paveikti ilgalaikę konkurenciją su O1 ir kitais JAV pagamintais modeliais, yra cenzūra. Kinijos modeliai dažnai apima blokus tam tikra tema, tai reiškia, kad nors jie veikia palyginti su kitais modeliais, jie gali neatsakyti į kai kurias užklausas (žiūrėkite, kaip „Deepseek“ AI asistentas atsako į klausimus apie Tiananmeno aikštę ir Taivaną).
Gruodžio mėn. ZDNET Tiernan Ray palygino „R1-Lite“ sugebėjimą paaiškinti savo minties grandinę su O1, o rezultatai buvo nevienodi.
Taip pat: Įmonės diegia „greičio apribojimą“ dislokuodami „Gen AI“ – štai kodėl
Be abejo, visi populiarūs modeliai yra su savo raudonaisiais etapais, bendruomenės gairėmis ir turinio apsaugos priemonėmis-tačiau bent jau šiame etape mažai tikėtina, kad amerikiečių gaminami pokalbių botai neatsakys į klausimus apie istorinius įvykius.
Privatumo rūpesčiai
Duomenų privatumo nerimą, atsirandantį dėl „Tiktok“-Kinijai priklausanti socialinės žiniasklaidos programa, kuri dabar yra šiek tiek uždrausta JAV-taip pat apima „Deepseek“.
„Asmeninė informacija, kurią renkame iš jūsų, gali būti saugoma serveryje, esančiame už šalies, kurioje gyvenate, ribų“, – teigiama „Deepseek“ privatumo politikoje. „Mes saugome informaciją, kurią renkame saugiuose serveriuose, esančiuose Kinijos Liaudies Respublikoje.”
Taip pat: „Paskutinis žmonijos egzaminas“ etalonas yra suklupęs aukščiausius AI modelius – ar galite padaryti geriau?
Politikoje aprašoma, kad „Deepseek“ renka daug informacijos, įskaitant, bet neapsiribojant::
-
„IP adresas, unikalūs įrenginių identifikatoriai ir slapukai”
-
„Gimimo data (jei taikoma), vartotojo vardas, el. Pašto adresas ir (arba) telefono numeris bei slaptažodis”
- „Jūsų tekstas ar garso įvestis, raginimas, įkelti failai, atsiliepimai, pokalbių istorija ar kitas turinys, kurį teikiate mūsų modeliui ir paslaugoms“.
- „Tapatybės ar amžiaus, atsiliepimų ar užklausų įrodymas apie jūsų naudojimąsi paslauga“, jei susisieksite su „Deepseek“
Politika tęsiasi: „Kai mes perkeliame bet kokią asmeninę informaciją iš šalies, kurioje jūs gyvenate, įskaitant vieną ar kelis tikslus, kaip išdėstyti šioje politikoje, mes tai padarysime laikydamiesi galiojančių duomenų apsaugos įstatymų reikalavimų”. Tai nemini GDPR atitikties.
„Vartotojai turi žinoti, kad bet kokiems duomenims, kuriems dalijamasi su platforma, gali būti taikoma vyriausybė pagal Kinijos kibernetinio saugumo įstatymus, kurie įpareigoja įmones teikti prieigą prie duomenų, paprašius valdžios institucijų“, – sakė Adrianus Warmenhoven, „NordVPN“ saugumo patariamosios valdybos narys, Adrianus Warmenhoveno narys. „ZDNet“ pasakojo el. Paštu.
„„ Deepseek “AI modelis susidūrė su didėjančia neigiama atsisakymu spręsti politines temas“, – pridūrė jis. „Tai sukėlė susirūpinimą dėl galimo šališkumo ir išorinės įtakos platformos turinio moderavimo politikai.”
Taip pat: kaip apsaugoti savo privatumą nuo „Facebook“ – o kas neveikia
Anot kai kurių stebėtojų, tai, kad R1 yra atvirojo kodo, reiškia padidėjusį skaidrumą, suteikiant vartotojams galimybę patikrinti modelio šaltinio kodą, ar nėra su privatumo susijusios veiklos ženklų. Nepaisant to, „Deepseek“ taip pat išleido mažesnes „R1“ versijas, kurias galima atsisiųsti ir paleisti vietoje, kad būtų išvengta jokių rūpesčių dėl duomenų siunčiamų duomenis (priešingai nei prisijungti prie „Chatbot Online“). Visi pokalbių programos, įskaitant „ChatGPT“, renka tam tikrą vartotojo duomenų laipsnį, kai jie yra užklausti per naršyklę.
Ką tai reiškia AI
R1 sėkmė pabrėžia Jūros pokyčius AI, kuris galėtų suteikti galimybę mažesnėms laboratorijoms ir tyrėjams kurti konkurencinius modelius ir paįvairinti turimų galimybių sritį. Pavyzdžiui, organizacijos, neturinčios „Openai“ finansavimo ar darbuotojų, gali atsisiųsti R1 ir tiksliai sureguliuoti ją konkuruoti su tokiais modeliais kaip O1. Prieš pat „R1“ išleidimą, „UC Berkeley“ tyrėjai sukūrė atvirojo kodo modelį, kuris yra panašus į „O1-Preview“, ankstyvą O1 versiją, vos per 19 valandų ir už maždaug 450 USD.
Atsižvelgiant į tai, kaip tapo ekshorbitančia AI investicija, daugelis spėlioja, kad ši vystymasis galėtų sprogti AI burbulą. Kelios ataskaitos rodo, kad akcijų rinka jau panikuoja.
Taip pat: 450 USD ir 19 valandų, ko reikia norint konkuruoti „Openai“ O1-prevence
„Deepseek“ pakilimas atsiranda kritiniu metu Kinijos ir Amerikos technologijų santykių metu, praėjus kelioms dienoms po to, kai ilgalaikis „Tiktok“ draudimas turėjo dalinį poveikį. Ironiška, bet „Deepseek“ paprastą kalbą apibūdina saugumo problemas, kurias JAV stengėsi įrodyti apie „Tiktok“ dėl savo užsitęsusių pastangų priimti draudimą.