Harvard şi Google lansează un set de un milion de cărţi din domeniul public pentru antrenarea AI

Harvard şi Google colaborează pentru a crea un set de date de un milion de cărţi din domeniul public, destinat antrenării modelelor AI, scrie TechCrunch.

Urmărește
72 afișări
Imaginea articolului Harvard şi Google lansează un set de un milion de cărţi din domeniul public pentru antrenarea AI

Harvard şi Google lansează un set de un milion de cărţi din domeniul public pentru antrenarea AI

Cărţile, care provin din proiectul de scanare Google Books, acoperă o varietate de genuri, limbi şi autori clasici precum Dickens, Dante şi Shakespeare, ale căror opere nu mai sunt protejate de drepturi de autor.

Setul de date face parte din iniţiativa Harvard Institutional Data Initiative (IDI), lansată oficial joi, şi beneficiază de susţinere financiară din partea Microsoft şi OpenAI.

Greg Leppert, directorul executiv al IDI, spune că obiectivul este de a „nivela terenul de joc”, oferind acces la un volum imens de date cercetătorilor şi startup-urilor din domeniul AI care doresc să-şi antreneze modelele lingvistice.

Momentan, nu se ştie când şi cum va fi disponibil acest set de date, dar implicarea Google promite o distribuire amplă a acestei resurse valoroase.

Proiectul reprezintă, de altfel, un pas important în democratizarea accesului la datele necesare pentru dezvoltarea inteligenţei artificiale, având potenţialul de a accelera progresul în cercetare şi inovare în domeniu.

Pentru cele mai importante ştiri ale zilei, transmise în timp real şi prezentate echidistant, daţi LIKE paginii noastre de Facebook!

Urmărește Mediafax pe Instagram ca să vezi imagini spectaculoase și povești din toată lumea!

Conținutul website-ului www.mediafax.ro este destinat exclusiv informării și uzului dumneavoastră personal. Este interzisă republicarea conținutului acestui site în lipsa unui acord din partea MEDIAFAX. Pentru a obține acest acord, vă rugăm să ne contactați la adresa vanzari@mediafax.ro.

 

Preluarea fără cost a materialelor de presă (text, foto si/sau video), purtătoare de drepturi de proprietate intelectuală, este aprobată de către www.mediafax.ro doar în limita a 250 de semne. Spaţiile şi URL-ul/hyperlink-ul nu sunt luate în considerare în numerotarea semnelor. Preluarea de informaţii poate fi făcută numai în acord cu termenii agreaţi şi menţionaţi aici