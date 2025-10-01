Wikipedia face un pas major către viitorul inteligenței artificiale, transformând modul în care informațiile sale sunt accesate și utilizate. Filiala Germană a Fundației Wikimedia a lansat Wikidata Embedding Project, un proiect care âși propune să ofere o experiență mai inteligentă și mai ușor de folosit pentru modelele AI. Această inițiativă poate revoluționa modul în care datele enciclopediei sunt integrate în aplicații și algoritmi moderni.

Ce aduce nou Wikidata Embedding Project pentru experiența utilizatorilor Wikipedia

Până acum, accesarea informațiilor de pe Wikipedia se realiza prin căutări tradiționale, limitate la cuvinte-cheie sau interogări complexe. Noua introduce o căutare semantică pe bază de vectori, care permite algoritmilor să înțeleagă relațiile și sensurile dintre termeni. Rezultatul este o bază de date de peste 120 de milioane de intrări, capabilă să răspundă la întrebări formulate în limbaj natural. Aceasta este compatibilă cu tehnici moderne precum retrieval augmented generation (RAG).

Proiectul, realizat în colaborare cu Jina.AI și DataStax, nu mai limitează Wikipedia la o simplă colecție de articole. Căutările devin mai inteligente: de exemplu, interogarea „om de știință” nu returnează doar nume, ci și subcategorii relevante, imagini aprobate de Wikimedia și traduceri în mai multe limbi. Termeni înrudiți, cum sunt „academic” sau „cercetător”, apar automat, oferind context suplimentar. Spre deosebire de alte seturi mari de date, precum Common Crawl, avantajul Wikidata Embedding constă în acuratețea informațiilor, verificate constant de comunitatea Wikipedia, scrie Ziare.com.

De ce este lansarea strategică acum

Momentul nu este întâmplător, având în vedere dezbaterile recente privind drepturile de autor, și utilizarea conținutului protejat pentru antrenarea . cazuri precum cel al Anthropic, care a plătit 1,5 miliarde de dolari pentru a închide un proces intentat de autori, subliniază importanța unor surse transparente și sustenabile. Wikidata Embedding oferă o alternativă legală și sigură pentru dezvoltatori, permițând construirea de aplicații AI fără riscuri legale majore.

Managerul proiectului AI de la Wikidata, Philippe Saadé, a subliniat autonomia inițiativei sale față de marile laboratoare de inteligență artificială și corporațiile tehnologice, într-un comunicat de presă. „Lansarea acestui Proiect de Embedding demonstrează că o inteligență artificială puternică nu trebuie să fie controlată de un număr restrâns de companii”, a declarat Saadé pentru jurnaliști. „Poate fi deschisă, colaborativă și construită pentru a servi pe toată lumea.”, relatează .