语料库,通常是指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体[1]。早期的语料库一般只包括带有语言学信息标注的文字资源,在信息技术高速发展的今天,随着摄像技术和数字摄像机的普及应用,数字视频资源已成为语料库的重要组成部分。国家组织或批准建设的大型语料库项目,如2008年10月教育部、国家语委启动的“中国语言资源有声数据库”(简称“有声数据库”),2012年国家社会科学基金重大项目“汉语方言自然口语有声基础语料库”(简称“有声基础语料库”),2015年5月教育部、国家语委正式启动的“中国语言资源保护工程”(简称“语保工程”)等,均将视频资源作为重要的基础组成部分,并提出了明确的采集要求。
数字视频技术是利用数字化手段对视频进行录制、存储、编辑以及播放的一种计算机技术,以数字文件形式保存的视频可以通过计算机进行检索和编辑处理。将数字视频技术应用于语料库建设中既有利于语言资源的保存和传承,又便于检索和加工处理,还有利于语言资源研究成果的立体化、多样化和信息化、网络化。
1 语料库建设对视频资源的要求
2 视频的录制与后期处理
3 视频录制和后期处理的有关事项
4 结语
视频文件已成为语料库的重要组成部分,采用数字视频技术进行语料录制并对录制后的视频文件进行适当技术处理,不仅可以确保视频文件符合语料库建设要求,同时对语料库的建设和研究成果的推广、对语言资源的发掘和保护都具有重要意义。
参考文献
[1] 中国社会科学院语言研究所.中国语言学年鉴:1999-2003[M].北京:商务印书馆,2006:363-385.
[2] 中国语言资源有声数据库建设领导小组办公室.中国语言资源有声数据库调查手册•汉语方言[S].北京:商务印书馆,2010.
[3] 教育部语言文字信息管理司,中国语言资源保护研究中心.中国语言资源调查手册•汉语方言[S].北京:商务印书馆,2015.
李宪武 山东女子学院 |