Carabela-projek: kunsmatige intelligensie om die geheime van die geskiedenis van Spanje te openbaar

Carabela-projek: kunsmatige intelligensie om die geheime van die geskiedenis van Spanje te openbaar


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Kunsmatige intelligensie (AI) en masjienleer (ML) tot diens van historici, tesame met algoritmes wat dokumente opspoor wat van groot belang is vir die geskiedenis van Spanje. Daaragter is Carabela-projek, 'n projek wat die afgelope twee jaar ontwikkel is deur navorsers van die Polytechnic University of Valencia (UPV) en die Centre for Underwater Archaeology van die Andalusiese Instituut vir Historiese Erfenis.

Binne hierdie raamwerk het hulle ontwikkel en toegepas nuwe AI / ML tegnieke wat toegang bied tot die inhoud van meer as 130 000 beelde uit die Algemene Argief van Indië en die Provinsiale Historiese Argief van Cádiz. Die projek het steun ontvang van die BBVA-stigting se Aid for Scientific Research Teams-program op die gebied van digitale geesteswetenskappe.

“Met hierdie tegnieke kan ons enige grafiese dokument met dieselfde spoed as 'n internetsoekenjin opspoor en spesifieke woorde, kombinasies van woorde, frases, ens. Identifiseer. Dit alles danksy statistiese modelle wat ons uit voorbeelde opgelei het en wat nou die groot bondgenote is vir die bestudering van hierdie versamelings in die geskiedenis van Spanje. En dieselfde metodes kan ook op baie ander historiese dokumente toegepas word ”, beklemtoon Enrique Vidal, navorser van die UPV se sentrum vir patroonherkenning en mensetaaltegnologieë (PRHLT).

Algemene Argief van Indië

Die fondse van die Algemene Argief van Indië Dit is van buitengewone belang vir die studie van die geskiedenis van Spanje in Amerika - van die suide van die Verenigde State tot Tierra de Fuego - en die Filippyne gedurende die 15de tot 19de eeu.

Gaan oor manuskripte met betrekking tot reis en handel in die Spaanse vloot, waarvan die ontleding nie gedoen kan word met tradisionele OCR-transkripsietegnieke nie - aangesien dit bedoel is vir gedrukte teks - en ook nie met spesifieke tegnieke vir handgeskrewe materiaal nie, aangesien die resultate wat dit bied wanneer dit op hierdie historiese tekste toegepas word, te onnauwkeurig is.

"Carabela het ons toegelaat om verder te gaan, met masjienleertegnieke wat beelde van handgeskrewe teks in groot versamelings historiese dokumente laat indekseer waarvan die bewaring en ingewikkelde skryfstyle dit vir mense byna onmoontlik maak om hul dokumente te lees," sê Joan Andreu. Sánchez, ook 'n navorser aan die PRHLT-UPV.

Hierdie tegnieke kan die verskillende soorte letters identifiseer en onderskei in elk van die tydperke waarin die dokumente gedateer word en ontleed selfs beelde waarvan die kwaliteit baie laag is.

Die sleutel is in die kapasiteit van sy algoritmes om modelle te verkry wat outomaties 'geleer' word uit voorbeelde.

“Sulke modelle benodig 'n relatiewe klein hoeveelheid leergegewens om baie bevredigende resultate te behaal. Met hierdie metodes kan ons bevredigend reageer op die uitdagings wat die dokumente self bied, soos die verskille in spelling, vlekke of beeldkwaliteit, ”voeg Vidal by.

In hierdie geval, leer is gedoen met ongeveer 500 bladsye uit die Archivo de Indias, wat deur Carlos Alonso en sy span spesialiste van die Sentrum vir Onderwater Argeologie gekies en getranskribeer is.

Wrakke en Australië

Caravel het aan die lig gebring manuskripinligting oor wrakke wat 'n argeologiese erfenis van die eerste omvang vorm, vanweë die groot historiese en kulturele rykdom van die inhoud. "Carabela dra dus ook daartoe by om die plundering van ondergedompelde erfenis te vermy", verduidelik Joan Andreu Sánchez.

Een van die verrassendste bevindings in hierdie fondse het ongetwyfeld plaasgevind toe, op soek na terme wat verband hou met Australië, soos 'Tierra Austral Incognita', 'n brief uit die vroeë 18de eeu gerig aan koning Felipe V.

“In hierdie brief, geskryf deur die Jesuïet Andrés Serrano, het ons baie presiese verwysings na die suidelike kontinent wat terugdateer tot 1705 ontdek. lank voordat kaptein James Cook sy oewer in 1770 bereik het. Min bekende data oor die geskiedenis van Australië en wat ons nou ontdek deur middel van indeksering en waarskynlike soektegnieke wat in ons sentrum ontwikkel is, toe te pas, ”verduidelik Enrique Vidal.

LEES, die Goue Eeu en Transkribus

In dieselfde werk het die PRHLT-span deelgeneem aan die Europese READ-projek, wat bestudeer en ontleed is dokumente uit die Goue Eeu van die Spaanse literatuur, tussen hulle Lope de Vega manuskripte uit die versameling van die Nasionale Biblioteek, en korrespondensie van die broers Grimm van die Marburg-staatsargief.

Ook uit die Nasionale Argief van Finland, waarvan ongeveer 150 000 bladsye geïndekseer is, en in toekomstige projekte is dit van plan om ongeveer 1 miljoen bladsye te indekseer.

Ook, Binne die raamwerk van die projek is Transkribus ontwikkel, 'n sagtewareplatform wat die aantekening van beelde van ou dokumente van groot historiografiese waarde toelaat.

Transkribus word hoofsaaklik gebruik as 'n opleidingsinstrument vir opleidingsdataaangesien handgeskrewe teksherkenningstegnieke data nodig het om outomaties te leer. In die nabye toekoms sal dit ander funksies bevat, soos outomatiese modelopleiding vir ander tale.

READ het ook afgesluit met die oprigting van 'n Europese koöperasie waarvan die UPV 'n stigterslid is en wat die Transkribus-sagteware beskikbaar stel vir alle geregistreerde gebruikers.

Tans is die Transkribus-platform Dit het meer as 30 000 gebruikers van regoor die wêreld, wat dit 'n internasionale verwysingsinstrument vir alle historici maak.


Video: CREËREN VAN DE ECHTE NIEUWE WERELD. SCHONE LUCHT, SCHOON WATER, SCHONE GROND EN SCHONE ETHER. LEVEN.