Descrición

Para dixitalizar discos de vinilo e casetes, emprégase unha platina ou un tocadiscos —segundo o formato de orixe—, un amplificador de audio e un ordenador. O sinal de audio procedente da platina ou do tocadiscos transmítese ao ordenador a través do amplificador. Mediante programas de gravación como Audacity ou Wavepad, captúrase nun ficheiro dixital todo o contido reproducido. Segundo o estado de conservación do casete ou do disco, o ficheiro resultante pode requirir un procesamento adicional para eliminar ruídos e mellorar a calidade do son. Unha vez optimizado o audio, transfórmase nun ficheiro de vídeo engadíndolle unha carátula deseñada especificamente para este tipo de contidos. Este proceso automatízase mediante o uso dun script e do software FFmpeg. Por último, extráese manualmente cada ficheiro, catalógase e etiquétase coa información correspondente para a súa incorporación ao corpus.

Cada ficheiro de vídeo ou audio dentro do corpus está asignado a un código único que permite identificalo segundo varios criterios: o tipo de texto humorístico (mon=monólogo; chis=chiste; ske=sketch; ven=ventrílocuo), as características do falante (sexo = M/H), a xeración ou idade (mozos = 1, adultos = 2, maiores = 3), a categoría profesional do falante (non profesional = 0, profesional = 1), o código da provincia e o número correspondente dentro do corpus. Por exemplo, o código 0171-CHI-BARH21 interprétase como un chiste (o número 0171 dentro de Humcor) dun falante varón, adulto, profesional, orixinario da provincia de Barcelona.

Na transcrición dos ficheiros seguíronse as normas xerais de escritura do español, coa excepción do uso de maiúsculas, que se limitan exclusivamente aos nomes propios. Para a codificación, adoptouse un sistema de marcas e etiquetas mínimas baseado no Standard Generalized Markup Language (SGML), segundo as especificacións da Text Encoding Initiative (TEI). Non se empregan signos de puntuación convencionais; en lugar diso, utilízanse marcas específicas para indicar pausas de distinta duración.