Baidu, Kinas største søgemaskine og en leder inden for kunstig intelligens, skal lancere sin egen generative AI-model Ernie 3.5, som kan skabe tekst, billeder og lyd fra nogle ord eller en skitse. Meddelelsen blev gjort af Baidus medstifter og administrerende direktør Robin Li på Zhongguancun Forum, et af Kinas mest kendte teknologifora, rapporterer Reuters.
Hvad er Ernie 3.5?
Ernie 3.5 er en stor sprogmodel (LLM), der bruger dybe neurale netværk til at lære af enorme mængder tekstdata og generere naturlige sprogoutput. Den er lig OpenAI’s ChatGPT-modeller, som er blevet brugt til forskellige applikationer som chatbots, tekstsammenfatning, billedtekstning og mere.
Ernie 3.5 er den seneste version af Baidus Ernie-serie, som står for Enhanced Representation through kNowledge IntEgration. Den første version af Ernie blev frigivet i 2019 og opnåede topresultater på flere naturlige sprogbehandlingsopgaver. Siden da har Baidu forbedret sin model med mere data, flere parametre og flere funktioner.
Ifølge Li har Ernie 3.5 over 100 milliarder parametre, hvilket gør den til en af de største LLM’er i verden. Den kan håndtere flere sprog, domæner og modaliteter, som tekst, tale, billede og video. Den kan også udføre tværmodal generering, for eksempel konvertere tekst til billeder eller tale til tekst.
Anvendelserne af Ernie 3.5
En af de vigtigste anvendelser af Ernie 3.5 er Ernie Bot, en chatbot der kan konversere med brugere om forskellige emner og scenarier. Ernie Bot blev først vist frem for offentligheden i marts i år til blandede anmeldelser. Nogle brugere roste dens evne til at generere sammenhængende og relevante svar, mens andre kritiserede dens mangel på personlighed og nogle gange fejl.
Li sagde, at Ernie Bot og andre produkter drevet af Ernie 3.5 har været i testtilstand, med et udvalg af virksomheder og brugere inviteret til at teste produkterne og give feedback. Han sagde, at Baidu vil “meget snart” officielt lancere Ernie 3.5 og gøre den tilgængelig for udviklere og virksomheder.
En anden anvendelse af Ernie 3.5 er at opgradere Baidus søgemaskine, som allerede drives af AI-teknologier som naturlig sprogforståelse, viden graf og stemmegenkendelse. Li sagde, at Ernie 3.5 vil muliggøre for Baidu at tilbyde mere nøjagtige og personlige søgeresultater samt mere varieret og kreativt indhold.
Hvorfor investerer Baidu i generativ AI?
Baidus investering i generativ AI er en del af dens bredere strategi om at blive en global leder inden for AI og reducere sin afhængighed af den amerikanske teknologiske base. Kina har stræbt efter sine egne store sprogmodeller som svar på den amerikansk-kinesiske opdeling, der har givet anledning til et delt teknologilandskab mellem de to store økonomier rapporteret af TechCrunch.
Baidu er ikke det eneste kinesiske firma, der udvikler generative AI-modeller. Ifølge en rapport fra Synced Review, en medieplatform der fokuserer på AI-forskning og industrinyheder, lancerede kinesiske organisationer 79 AI-store sprogmodeller siden 2020, der dækker forskellige sprog, domæner og modaliteter.
Li forudsagde, at Kina vil føre an i at opdage kommercielle anvendelser for generativ AI, som det har gjort for andre nye teknologier tidligere. Han sagde, at Kina har varmt omfavnet nye teknologier og udviklet en række innovative anvendelser der er populære og nyttige.
“Jeg er meget optimistisk om Kinas AI-udvikling”, sagde Li. “Teknologien giver en masse muligheder og vi er gode til at fange dem for at bygge applikationer.”