Història

PhiloBiblon està basat en i deriva de BOOST (Bibliography of Old Spanish Texts), rebatejat com BETA (Bibliografía Española de Textos Antiguos) en 1992 per a l'edició del projecte ADMYTE (Archivo Digital de Manuscritos y Textos Españoles) en CD-ROM. Per a BETA i el Diccionario del español antiguo de la Universidad de Wisconsin (Madison), projecte aquest últim del que BETA deriva, vegeu si us plau la pàgina principal de BETA. La primera edició impresa de BOOST es publicà en 1975, la segona en 1977 i la tercera en 1984. La primera edició de la Bibliography of Old Catalan Texts (BOOCT=Bibliografía de Antiguos Textos Catalanes), exactament en el mateix format que BOOST₃, veiè la llum en 1985. En 1988 començà a rodar el que originalment s'anomenaria Bibliography of Old Portuguese Texts (BOOPT=Bibliografía de Antiguos Textos Portugueses). Ambdós projectes, BOOCT i BOOPT, reberen en 1992 noms nous per al CD-ROM d'ADMYTE com BITECA i BITAGAP. Finalment, en 1997 el projecte BIPA extengué la projecció global del projecte fins als textos poètics dels segles XVI i XVII.

La collaboració amb colegues a España, particularment amb Francisco Marcos Marín (llavors a la Universidad Autónoma de Madrid, ara a la University of Texas, San Antonio), permeté a BETA, BITAGAP i BITECA, així com al sistema de control de la base de dades, formar part de l'esmentat ADMYTE (Archivo Digital de Manuscritos y Textos Españoles), un dels projectes finançats per la Sociedad Estatal del Quinto Centenario per commemorar l'aniversari del primer viatge de Colón a Amèrica. Les tres bibliografies foren publicades en CD-ROM com part del disc 0 d'ADMYTE, editat per Micronet, SA (Madrid). Una edició revisada i ampliada de PhiloBiblon, amb les mateixes bibliografies incloses, fou publicat en CD-ROM per la Bancroft Library (University of California, Berkeley), en l'any 1999.

En 1997, gràcies a un complement de finançament del NEH (National Endowment for Humanities = Dotacions Nacionals per a les Humanitats) a les ajudes ja atorgades al projecte pels Programes d'Estudis Catalans Gaspar de Portolà i d'Estudos Portugueses (University of Califòrnia, Berkeley) i pel Centro de Estudos Portugueses e Galegos (University of Califòrnia, Santa Bàrbara), es va poder realitzar la pàgina web de PhiloBiblon, i així fou possible l'accès des de la xarxa a les descripcions detallades de manuscrits i impresos antics i dels textos que contenen. Les actualitzacions de les pàgines web es van fer aproximadament de forma trimestral, a mesura que els diferents equips d'investigació anaven afegint cada cop més dades a les seves respectives bibliografies.

En l'any 2001 es completà la migració de la base de dades BETA des del sistema operatiu MS-DOS fins a la versió de molt més capaç de Windows (vegeu més endavant). Des d'aquell moment, no fou possible actualitzar la versió de la xarxa de BETA, donat que el software aplicat a Internet estava construït sobre la versió en MS-DOS. Sí fou possible actualitzar regularment BITAGAP i BITECA, donat que la migració d'ambdues al sistema operatiu Windows no tingué lloc fins a la tardor de 2008, juntament amb BIPA. D'aquesta manera, ha estat solament a través d'aquesta nova pàgina web que totes les bibliografies han pogut reunir-se finalment amb el mateix nivell de desenvolupament.

La primera edició de BOOST (1975) contenia 966 registres, realitzats a través d'un sistema de control de base de dades de tipus fitxer pla, anomenat FAMULUS. Aquest sistema estigué allotjat en un ordenador model Univac 1110, a la University of Wisconsin en Madison. FAMULUS fou originariament escrit a Berkeley en 1967 per a la Pacific Southwest Forest and Range Experiment Station (United States Department of Agriculture). El programa estava dissenyat per al control de fitxes bibliogràfiques personals, escrites amb el codi universal ASCII utilitzant qualsevol editor de textos electrònic, de forma que després cadascuna de les fitxes bibliogràfiques fos indexada completament. Les limitacions d'aquest sistema per a l'organització dels materials més complexos eran realment greus: només es podia emprar un màxim de deu camps, d'extensió variable, amb un màxim de 4000 caracters escrits per fitxa. Per compensar aquestes limitacions, algunes dades relacionades però realment dissimblants foren agrupades en un únic camp a la versió original de BOOST, la primera de totes. Així, en el camp AUTH (autor) no només estava inclós el nom de l'autor, sinó els noms dels editors, traductors i d'altres.

FAMULUS permet visualitzar qualsevol dels camps en quelsevol ordre, tot i que els termes d'indexació estan limitats a un màxim de quaranta caràcters. L'ordre dels camps dins d'una fitxa i de les fitxes dins de la base de dades es pot canviar a voluntat de l'usuari, i així la base de dades completa pot canviar la seva presentació i reindexar-se de nou a partir d'aquest nou ordre. La versió impresa de BOOST de l'any 1975 consistí bàsicament en presentar totes les fitxes ordenades jeràrquicament per ordre alfabètic (autor / títol / data / ubicació actual) i seguides dels índexs de cadascun dels camps, més els índexs de paraules clau dels camps relatius a autors i títols. La versió fou impresa mitjançant photo-offset en format d'impresora d'ordenador apaïsat, amb totes les lletres en majúscula.

La segona edició (1977) mantingué el mateix nombre de camps i les mateixes limitacions en la indexació, però la presentació era una mica més elegant: en format de foli normal, a doble columna, amb una atractiva font del tipus serif, però encara amb tota la impresió en lletra majúscula.

Quan el control editorial de BOOST passà en l'any 1981 a un nou equip d'investigació, el Medieval Spanish Seminary de Madison continuà essent el proveïdor del suport tècnic. Es tornà a reescriure FAMULUS per adaptar-lo a les necessitats del projecte, però sense les limitacions que aquest presentava quant a nombre de camps, la seva extensió o el nombre de caràcters en els termes d'indexació. Fou així que la tercera edició de BOOST (1984) contenia catorze camps per cada fitxa i permeté imprimir termes d'indexació de fins a 159 caracters.

La introducció d'un canvi tècnic en la tercera edició de BOOST, com fou la ordenació topogràfica de la base de dades (ciutat / biblioteca / signatura / ordre de foliació) va requerir la presència de dos camps nous:

(1) CSEQ, és a dir, la seqüència numèrica del manuscrit o imprès dins de cada biblioteca, ja que les signatures de molts d'ells no són estrictament alfanumèriques en algunes biblioteques, p. e., la del Real Monasterio de El Escorial.

(2) FSEQ, ordre seqüencial d'un text concret dins del manuscrit que el conté, d'acord amb la foliació. D'altres canvis en l'estructura de les fitxes reflexaren les necessitats d'informació percebudes pel nou comitè editorial del projecte.

Per exemple, les fórmules per a datar els volums als antics camps OPDT (Original PRoduction DaTe=Data original de producció) i SPDT (Specific Production DaTe= Data específica de producció) com "mitjans del segle XV", o "finals del segle XV", no només eren molt ambigües, sinó que a més estaven ordenades més alfanumèricament que de forma cronològica. Per evitar aquest problema en particular, totes les dades d'aquests camps es canviaren a valors numèrics absoluts: per exemple, "1440-1460" substituï a l'antiga designació de "mitjans del segle XV".

Amb el canvi en l'ordre jeràrquic, és a dir, amb el pas de l'ordre autor / títol a un ordre topogràfic (ciutat / biblioteca / signatura), sorgí la dificultat de controlar la relació entre els registres de BOOST₂ i BOOST₃. Per resoldre-ho, el número de control (Control NUMber, CNUM) de cada fitxa, que s'havia mantingut constant en totes les fitxes, començà a emprar-se com l'element d'enllaç entre les dues edicións.

Altres dos canvis estigueren relacionats amb la reestructuració de diversos camps en un. Així, tota la informació bibliogràfica dels camps BIBS i NOTE de BOOST₂ (que s'havien emprat per diferenciar, respectivament, fonts bibliogràfiques citades directament d'aquelles altres citades de forma indirecta), fou agrupada en un camp únic, BIBL, per tal de crear un únic i unificat índex bibliogràfic. Desafortunadament, això va dificultar molt el control a partir d'aquest moment en l'ús de la bibliografia secundària. L'ús del programa demostrà que aquesta fusió havia estat un error, com també ho fou la fusió dels camps GTIT (General or normalized TITle = Títol General o Normalitzat) i STIT (Specific or variant TITle = Títol Variant o Específic), error degut, com en el cas anterior, al desig de crear un únic índex per a aquests camps.

Ara bé, en altres punts del programa els camps foren dividits per reflexar les diferències intrínseques de les dades que contenen. Per exemple, els traductors van posar-se en el campo TRAN (Translator = traductor), sense barrejar-se amb el camp AUTH, reservat per als autors. Així mateix, els impressors i copistes van ser traslladats des del camp SPRL fins a un específic per a ells, de nova creació: PRSC. Tots dos canvis es van revelar com a molt encertats en tots els sentits, tant tàcticament com estratègica, per als usuaris del programa.

Aquesta fou l'estructura de base de dades que serví per als repertoris de BOOST₃ (1984) i BOOCT (1985).

En termes de procediment, les dades continuaven essent introduïdes en Madison a base de la informació proporcionada per l'equip editorial. La base de dades, ordenat de nou, fou llavors reindexada i impresa, i el text resultant fou enviat als editors per a la seva correcció i per a un nou cicle d'introducció de dades. Aquest procés era embolicat, i encara ho fou més per la manipulació del fitxer de base de dades FAMULUS, el qual requeria que cada registre estigués complet en ell mateix. Així, si un manuscrit contenia vint textos, la descripció completa del manuscrit havia de repetir-se completa en cadascun dels vint registres.

Les limitacions d'un sistema com era FAMULUS foren posats de relleu cada vegada més por l'existència d'altres sistemes més sofisticats. El següent canvi tecnològic tingué lloc en 1985, amb la migració de BOOST i BOOCT des del vell sistema de Madison a un nou sistema en la University of Califòrnia a Berkeley: SPIRES (Stanford Public Information Retrieval System = Sistema Stanford de Recuperació d'Informació Pública). Les capacitats de SPIRES el convertiren en una atractiva solució per als antics problemes de FAMULUS: es tractava d'un programa interactiu, orientat a les dades textuals, que permetia la repetició de camps sense limitació del nombre de caràcters. Operacions com l'ordenació de dades, les recerques i la generació d'informes es feien de forma raonablement senzilla. Ara bé, l'entrada de dades i la seva correcció un cop introduïts es feia d'una forma més complexa que en el sistema antic.

Finalment en 1987, i gràcies al finançament d'IBM, ambdues bibliografies foren transportades al sistema Revelation (més endavant rebatejat com Advanced Revelation, de Revelation Technologies), un sistema de base de dades d'altes prestacions que operaba sota MS-DOS i que, com novetat més important, presentava la possibilitat de que camps d'extensió variable i repetida poguessin estar enllaçats mitjançant estructures també repetibles, a més de no tenir limitacions en el nombre de registres i de camps. Només existía un mínim i raonable límit en la mida de cadascun dels registres, que no podia excedir de 64K, limitació que també operava pel que feia a la longitut de cadascun dels camps individuals.

Una primera consideració a l'hora de triar un sistema relacional de base de dades fou complir el desig de posseir un sistema molt més senzill de mantenir i d'actualitzar, al permetre que qualsevol canvi fet en un dels registres s'efectués també de forma automàtica en tots aquells registres als que estava vinculat. Gràcias a aquesta particularitat, es va desterrar la vella operació de fer el mateix canvi en múltiples registres.

Així doncs, des de 1987 totes les dades de les quatre bibliografies han estat distribuïts i manipulats per diferents versions d'aquesta mateixa base de dades, realitzada i desenvolupada any rere any per Revelation Technologies.

El disseny original de la base de dades de 1987, degut al treball conjunt del professor Charles Faulhaber i del programador John May, s'ha beneficiat en el seu desenvolupament de nou ajudes de finançament concedides per NEH, a més de tot un ampli ventall d'altres aportacions més petites, però no per això menys significatives. Amb tot, han estat els constants informes, suports i subministraments de dades efectuats pels membres de tots els grups d'investigació els que han acabat de perfilar el programa actual. L'any 2001, l'estructura de la base de dades de PhiloBiblon consistia ja en deu taules amb més de 650 camps de dades individuals.

El primer transport de dades a la pàgina web de PhiloBiblon es va realitzar l'any 1997, prenent com a base les fitxes de MS_ED (descripcions de manuscrits i edicions impreses) i bolcant tot el seu contingut en arxius de text amb el codi general ASCII. Els operaris de la biblioteca de Berkeley dissenyaren un "guió PERL" per convertir les dades de cada manuscrit o imprés antic de les tres bibliografies constitutives (BETA, BITECA i BITAGAP) en fitxes codificats segons el llenguatge HTML. Aquestes fitxes foren indexades emprant un senzill programa de domini públic (SWISH) i es van posar a lliure disposició dels investigadors a la xarxa. Així mateix, un senzill instrument de recerca (CGI) permeté realitzar a Internet cerques per autor, per títol o per paraules claus del text desitjat.

En l'any 2001 altra ajuda financera de NEH feu possible la migració de dades des d'un sistema basat en MS-DOS a un nou programa dissenyat per Advanced Revelation sobre suport Windows. En el procés de migració, l'estructura de les fitxes es feu més recional, al mateix temps que d'altres camps de dades foren afegits fins a arribar al número actual de 987 camps en les mateixes deu taules interrelacionades.

Com en les versions anteriors, uns codis d'identificació únics s'utilitzan per a identificar textos (texid), còpies de textos (cnum), manuscrits o impresos antics (manid), exemplars dels impresos (copid) i persones (bioid). Aquests codis, diferents en cada bibliografia, son d'utilitat molt gran per a diferenciar entre obres distinctes però amb títols idéntics o entre persones homónimes. Por aquesta raó han estat retinguts en la versió web.

Les bibliografies

Història tècnica del sistema