- Created by Núria Raga, last updated by imma.aibar@csuc.cat on Jul 21, 2025 8 minute read
1.1 Qui pot dipositar?
- Per dipositar i publicar un conjunt de dades, almenys un/a dels autors/es del conjunt de dades ha d’estar afiliat/da a la universitat o centre de recerca en el moment de l’obtenció i/o generació de les dades. En el cas que cap autor/a estigui afiliat/da, també s’acceptaran aquells conjunts de dades d’autors/es que tinguin l’autorització de la institució.
- En el cas que el personal investigador deixi la institució però necessiti fer una nova versió d’un conjunt de dades ja dipositat al repositori, es permetrà amb el vistiplau de la interlocució tècnica de la institució.
- Es demana que almenys un/a dels/les autors/es disposi d’un identificador únic, com és l’ORCID, i que s’inclogui aquesta informació a les metadades.
- La publicació al repositori requerirà de la validació de la interlocució tècnica de la institució segons les necessitats o funcionament de l’entitat responsable de les dades (universitat o centre de recerca).
- Recau en l’autor/a informar a l’investigador/a principal i/o director/a del projecte de recerca i tenir-ne el seu vistiplau previ. De la mateixa manera, els/les doctorands/es seguiran els procediments de la seva institució.
- Les institucions podran aprovar casos excepcionals on hi hagi un lliurament col·lectiu de la pròpia institució o d'una de les seves unitats on no s'hagi de consignar autories individuals. Tot i així caldrà indicar a les metadades el nom d'una persona com a dipositant i contacte del conjunt de dades.
1.2 Què es permet dipositar?
- Es permet el dipòsit i publicació de dades de recerca. S’entén per dades de recerca, l’evidència no teòrica que fonamenta les conclusions derivades d’un treball d’investigació i que es pot utilitzar per validar aquestes conclusions. Es pot tractar d’informació quantitativa o qualitativa recollida durant el desenvolupament d’una investigació mitjançant l’experimentació, l’observació, el modelatge, l’entrevista, informacions extretes d’altres fonts (de les quals es poden retenir els drets) o d’altres mètodes. Les dades poden ser primàries o derivades de dades primàries.
- Qualsevol format de fitxer és acceptat. No obstant això, s’aconsella proporcionar dades en formats no propietaris per tal d’assegurar un ús més ampli i per raons de sostenibilitat a llarg termini. Es recomanen i preserven els formats indicats a la taula: “Formats recomanats i acceptats”.
1.3 Què no es permet dipositar?
Els sistemes de gestió de la recerca (CRIS) són els encarregats d'incloure la informació dels conjunts de dades fets a la institució, independentment d'on s'hagin dipositat. El Portal de la Recerca de Catalunya es nodreix de la informació proporcionada pels sistemes CRIS de les diferents institucions que hi participen i és, per tant, l'instrument que fa de catàleg dels conjunts de dades del sistema de recerca de Catalunya.
- Conjunt de dades que no compleixen amb els requisits del 1.4 d’aquest reglament i dels quals només es vol disposar de la informació de les metadades per tal de tenir-ne constància.
1.4 Què ha de contenir un conjunt de dades?
- Un conjunt de dades ha d'incloure els fitxers que contenen les dades, les metadades associades, la documentació descriptiva, els drets i la llicència d’ús.
- La tipologia de dades i formats que han de contenir els fitxers es troba descrita en l'apartat 1.2 del Reglament.
- S’han d’introduir les metadades mínimes obligatòries seguint les directrius establertes.
- La documentació descriptiva mínima obligatòria és un fitxer de text pla (README) que descriu el contingut del conjunt de dades.
- La llicència ha de seguir els requeriments descrits a l’apartat 2 del Reglament.
- Cada conjunt de dades ha de tenir, com a mínim, un contacte designat per tal de garantir, almenys durant el període establert de preservació, qualsevol petició relacionada amb el mateix.
1.5 Mida dels conjunt de dades
- Es permet el dipòsit de conjunts de dades fins a 500 GB o menys de 5000 fitxers per defecte.
- Malgrat aquest límit, s'admetran conjunts de dades de mida més gran que tinguin una petició expressa signada per part de la universitat pel vicerectorat de recerca de la universitat, o qui delegui, o per part dels centres de recerca per la direcció científica, o qui faci les seves funcions; així com, el vistiplau de la Direcció General del CSUC seguint el “Procediment per dipositar datasets de més de 500GB i/o 5.000 fitxers”.
Quan es publica un conjunt de dades a l'RDR, cal definir una llicència per tal d’informar als usuaris de les condicions de reutilització de les dades. Es recomana l’ús de les llicències CreativeCommons (CC) CC0 i CC-BY seguint el lema de la Unió Europea "Tan obert com sigui possible i tan tancat com sigui necessari" per millorar el descobriment, la comprensió i la reutilització de les dades de recerca.
- La persona que fa el dipòsit ha de seleccionar una llicència d’una llista predefinida. RDR ofereix una gamma completa de llicències Creative Commons, adoptant la CC0 (Creative Commons Zero) com a llicència definida per defecte.
- La persona que fa el dipòsit pot definir una llicència diferent a les Creative Commons, seleccionant “Custom Dataset Terms”. En aquest cas, cal que descrigui les condicions d’ús de les dades, segons la llicència escollida.
- Es poden utilitzar llicències específiques per dades de recerca i bases de dades, com les que ofereix Open Data Commons: ODC-BY, ODbL i PDDL.
- També es poden aplicar llicències específiques per a programari, aprovades per la Open SourceIniciative (OSI): GNU General PublicLicenses, European Union PublicLicense i MIT license, entre altres.
- Les metadades dels conjunt de dades publicats a l'RDR estan accessibles mitjançant el protocol OAI-PMH i subjectes a la llicència CC0.
- Dades en obert. No hi ha restriccions en el seu accés, cosa que permet que qualsevol persona pugui veure-les i descarregar-les. Aquesta és la opció més adequada per publicar dades que no són confidencials, sensibles, comercials o amb altres restriccions legals.
- Dades embargades. Hi ha restriccions temporals en el seu accés. Aquest embargament podrà aplicar-se a la totalitat o part del conjunt de dades, perquè no siguin accessibles durant un termini màxim de dos anys. Tot i així, les metadades del conjunt de dades sempre seran visibles.
- Dades restringides. Hi ha restriccions en el seu accés. La persona investigadora i/o institució pot considerar restringir les dades de recerca sempre que sigui per raons de copyright, temes ètics o de confidencialitat. Cal subratllar que el principi bàsic de les dades de la investigació finançada amb fons públics és que les dades han de ser tan accessibles com sigui possible i estar tan protegides com sigui necessari. Tot i així, les metadades del conjunt de dades sempre seran visibles.
Per retirar un conjunt de dades publicat al repositori cal donar-lo de baixa. Això suposarà que deixarà de ser accessible, però es podrà consultar, per mitjà del DOI, la citació del conjunt de dades i el motiu pel qual s’ha donat de baixa. En cap cas, es podrà eliminar el DOI, ja que és un identificador registrat a DataCite i ha de ser permanent en el temps.
- No es permet eliminar un conjunt de dades publicat però es pot donar de baixa. Aquesta acció només ha de produir-se si hi ha una raó legal i/o vàlida.
- Per donar de baixa un conjunt de dades cal posar-se en contacte amb la persona responsable de la instància indicant-ne els motius. La institució, seguint les seves pròpies consideracions, farà efectiva o no la baixa.
- Els conjunt de dades en esborrany que faci més de 12 mesos que es troben dipositats al repositori entraran en procés de revisió amb l’objectiu final de publicar-se o eliminar-se. A partir d’aquesta data, es contactarà amb qui consti a l’apartat de contacte del registre per valorar l’estat del conjunt de dades i dur a terme l’acció pertinent.
RDR no accepta actualment:
- Dades personals. Les dades de caràcter personal que identifiquen o poden identificar persones concretes de manera directa o indirecta no es poden introduir al RDR. Aquestes dades necessiten una especial protecció i normes específiques per evitar els riscos derivats del seu tractament. Les dades de caràcter personal que estiguin anonimitzades sí que s'hi poden dipositar.
Autor/a | Persona que ha dut a terme la recerca i que ha contribuït a la creació del conjunt de dades de recerca. Aquesta persona pot ser, però no necessàriament, la mateixa que fa el dipòsit al repositori. |
Conjunt de dades (o dataset) | Recollida organitzada de dades o objectes en format computacional, que són generats o recollits pel personal investigador en el transcurs de la seva recerca, independentment de la seva forma o mètode, que formen l'objecte sobre el qual els investigadors comproven una hipòtesi. Això inclou tota la gamma de dades: conjunts de dades en brut, sense processar, dades generades i processades per propietat i dades secundàries obtingudes de tercers. La presentació de les dades a l'aplicació s'habilita mitjançant metadades (CODATA RDM Terminology). |
Contacte | Persona que actua com a contacte principal i proveïdor d'informació per a tercers que desitgin obtenir més informació sobre un conjunt de dades de recerca específic. |
Dipòsit | Acció de crear i afegir un registre en el repositori per a identificar un conjunt de dades. |
Documentació descriptiva | Informació sobre un conjunt de dades rellevant per a la comprensió, inspecció o reutilització d’aquest, incloent-hi informació descriptiva, sobre els drets, procedència, i especificacions tècniques, que pot estar continguda en diversos fitxers o en un sol fitxer README. |
Donar de baixa | Procés pel qual es revoca l'accés als fitxers d'un conjunt de dades de recerca conservant el seu DOI i l’accés a les metadades, sempre condicionat a una raó legal i/o vàlida per fer-ho. |
Embargament | També conegut com període de retenció. És la metadada que informa de la data a partir de la qual els fitxers del conjunt de dades estaran disponibles en accés obert. El període de retenció ha de tenir una política que informi què fer quan expiri el període (CODATA RDM Terminology). |
Identificador Persistent | Enllaç digital únic i permanent d’un objecte que proporciona informació sobre aquest objecte independentment del que li passi. Desenvolupat per abordar la corrupció d'enllaços, un identificador persistent es pot usar per proporcionar una representació adequada d'un objecte tant si aquest objecte canvia la seva ubicació en línia com si es desconnecta (CODATA RDM Terminology). |
Instància | Espai institucional, també anomenat dataverse, on els investigadors poden dipositar els seus conjunts de dades de recerca. |
Llicència | Autorització on s’estableixen les condicions sota les quals el conjunt de dades de recerca pot ser (re)utilitzat per altres. |
Metadades | Dades que descriuen i caracteritzen un conjunt de dades o un recurs de manera que la gent el pugui descobrir i identificar. A més, les metadades ofereixen detalls sobre l'estructura, la tipologia, l’autoria, la descripció, les publicacions relacionades, els drets i aspectes de preservació, facilitant així la gestió i l'ús eficient de les dades. (CODATA RDM Terminology). |
Preservació | Totes les accions gestionades que garanteixen i mantenen l'accés continuat als materials digitals durant el temps que sigui necessari i més enllà dels límits de la fallada dels mitjans o el canvi tecnològic. (CODATA RDM Terminology). |
Publicació | Divulgació de dades d'investigació, metadades associades, documentació acompanyant i codi de programari (en els casos en què les dades en brut s'han processat o manipulat) per a la seva reutilització i anàlisi de manera que es puguin descobrir a la web i fer-ne referència persistent amb un identificador únic i persistent. La publicació de dades es fa mitjançant dipòsits de dades i/o revistes (dades) dedicats que garanteixen que els conjunts de dades publicats siguin accessibles, interoperables i reutilitzables (CODATA RDM Terminology). |
