Prima pagină » Cultură-Media » Harvard şi Google lansează un set de un milion de cărţi din domeniul public pentru antrenarea AI

Harvard şi Google lansează un set de un milion de cărţi din domeniul public pentru antrenarea AI

Harvard şi Google colaborează pentru a crea un set de date de un milion de cărţi din domeniul public, destinat antrenării modelelor AI, scrie TechCrunch.
Harvard şi Google lansează un set de un milion de cărţi din domeniul public pentru antrenarea AI
Iulia Kelt
12 dec. 2024, 16:40, Social

Cărţile, care provin din proiectul de scanare Google Books, acoperă o varietate de genuri, limbi şi autori clasici precum Dickens, Dante şi Shakespeare, ale căror opere nu mai sunt protejate de drepturi de autor.

Setul de date face parte din iniţiativa Harvard Institutional Data Initiative (IDI), lansată oficial joi, şi beneficiază de susţinere financiară din partea Microsoft şi OpenAI.

Greg Leppert, directorul executiv al IDI, spune că obiectivul este de a „nivela terenul de joc”, oferind acces la un volum imens de date cercetătorilor şi startup-urilor din domeniul AI care doresc să-şi antreneze modelele lingvistice.

Momentan, nu se ştie când şi cum va fi disponibil acest set de date, dar implicarea Google promite o distribuire amplă a acestei resurse valoroase.

Proiectul reprezintă, de altfel, un pas important în democratizarea accesului la datele necesare pentru dezvoltarea inteligenţei artificiale, având potenţialul de a accelera progresul în cercetare şi inovare în domeniu.