O corpus C-ORAL-BRASIL é um recurso multimídia composto por um conjunto de arquivos em três formatos:
Arquivo "wav" (som);
Arquivo "rtf" (texto);
Arquivo "xml" (alinhamento texto-som).
Para ver um exemplo extraído do corpus, clique aqui para baixar os arquivos acima em formato "zip".
Cada transcrição possui um cabeçalho no qual
encontram-se informações referentes à
situação gravada e dados sociolinguísticos dos
participantes.
Clique aqui
para ver um exemplo de cabeçalho.
Para baixar o cabeçalho (formato "txt"), clique com o
botão direito no link e depois em Salvar link como... ou
Salvar destino como..., dependendo do seu navegador.
Instruções
Extraia os arquivos em uma pasta de seu computador.
Para abrir o alinhamento texto-som, você precisará ter o software Winpitch Pro instalado em seu computador.
Execute o Winpitch e abra o arquivo de extensão "xml" através do menu Alignment file.... O áudio será carregado simultaneamente.