语音视频(合集7篇)

时间：2023-01-15 15:31:52

语音视频第1篇

【关键词】初中语文；微音频；微视频；课堂

中图分类号：G631 文献标识码：A 文章编号：1671-0568（2017）07-0086-02

随着多媒体技术的发展，人们在工作和生活中经常接触到微音频和微视频。将这些内容多样的微音频和微视频引入初中语文课堂，往往能提高课堂教学的效率，促进学生对教材内容的理解。微音频和微视频的应用，能从听觉和视觉两个角度促M学生对课文文本内容的准确理解，改变课堂单纯文本教学沉闷枯燥的弊端，激发学生学习的兴趣。现代多媒体技术的快速进步，为微音频和微视频的制作和使用提供了良好的条件，使我们初中语文教师更为灵活方便地应用微音频和微视频辅助教学。

一、课堂教学中对微音频和微视频的选取

初中语文课堂上应用的微音频和微视频，主要是一些朗诵、乐曲、歌曲、广播剧片段、电视剧和电影音、视频片段。这些微音频和微视频在网络上非常多，便于我们随时下载使用。为了提高课堂教学效率，我们对微音频和微视频的选取都是根据课文内容选取适合的题材，以便更好地促进学生对教材文本内容的理解。在选取的时候，要考虑到怎么充分地调动学生思维，让他们更好地动脑筋，深化对教材文本内容的理解，而不只是为活跃课堂气氛，迎合学生的趣味，从而降低了微音频和微视频的使用效果。具体使用微音频还是微视频，主要取决于哪个更能调动学生的思维，不管是采用微音频还是微视频，都要根据课文内容的侧重点，细致地考虑。

有时候我们需要给学生留下思考的空间，就像山水画的“留白”一样，采用微音频反而比声、光、色俱全的微视频效果更好。山水画的“留白”就是空出一部分画面，任由看画的人根据已有景物去想象，眼目流动之间，已经浮想联翩，上下千年，实现了看画人的再创造，不同的看画人，对画“留白”的想象也是不同的，这就增强了画卷的韵味。比如对于诗词的教学，采用微音频，因不同的朗诵者原声，让学生通过朗诵时节奏、语调、情感的把握，来感受诗词的内容。学生随着朗诵者一字一句的朗诵，在各自的大脑中展现出不同的想象内容，对诗词内容形成各自不同的再创造，再让学生把自己心中所想，用语言表达出来，形成对诗词的多种合理理解。诗词教学采用微音频往往要比采用微视频效果好得多。微视频的一览无余往往会限制学生的思维，影响学生的再创造。有时候我们则需要全方位地调动学生的感官，让学生从各个角度直观地感受课文的文本内容，从而促进学生对教材内容的理解，这时使用微视频就比较好，视频立体式的效果使学生都有身临其境的感觉，能充分调动学生的听觉和视觉，激发学生从各个方面去感受课文的内容，无形中拓宽了学生的视野，丰富了学生的知识。比如在学习《故宫博物院》《苏州园林》时，采用微视频播放故宫和苏州园林的视频片段就比较好，让学生全方位地感受故宫和苏州园林的美，并把看到的美说出来，再与课本的文本内容进行对照，寻找自己的语言和课本语言的差异，理解课文文字的好处，从而提高学生对文字感受和处理的能力，促进学生语文能力的提升。

二、微音频和微视频在课堂播放时机的选择

在初中语文课堂上使用的微音频和微视频，一定要选择好播放时机，播放时机如果选择不好，会影响微音频和微视频使用的效果，也会影响课堂教学效率。播放时机的选择以能让学生充分展开思维为主，只有学生充分地思考了，才可以最大限度提高课堂教学效率。如果过早播放微音频和微视频，使教学内容提前让学生知道，会影响到学生思维的展开，影响学生的想象和联想。但过晚播放微音频和微视频，会使一些内容跟不上学生思考的进度，起不到穿针引线、画龙点睛的作用，浪费了辛苦准备的音视频资源。可以说在适当的时机，展示微音频和微视频是一项重要的课堂掌控技能，教师这个能力的高低直接影响着课堂教学效率的高低。运用之妙，存乎一心，这个能力需要长期的课堂实践来提高。

例如，在《观沧海》的教学中，如果有不同名家朗诵的微音频和曹操观沧海的微视频，在视频中基本上这首诗歌所涉及的景象基本都能看到，如果过早地播放曹操观沧海的微视频，往往让学生提前知道这首诗的内容，学生的思维没有得到充分的锻炼，鉴赏诗歌的能力也受到影响。如果在播放名家朗诵和学生充分讨论学习的基础上，再播放曹操在电视剧或电影中实际观沧海的视频，更容易起到画龙点睛的作用，也让学生在观看的同时找到自己没有想到的内容，这样更容易促进学生思维的发展。在课堂学习中，如果学生对于重难点理解的不透彻，就应逐一播放不同名家的朗诵片段，并与学生一起逐一感受和讨论名家对于重难点朗诵的不同角度和侧重点，这样会使学生对诗歌重难点理解不到位的问题迎刃而解。平时把握好时机，巧妙地利用微音频和微视频对文章的重难点进行启发教学，效果要比我们直白地进行纯语言的教学要好得多。

三、微音频和微视频的来源和制作

近年来，网络技术日新月异，发展迅猛，使微音频和微视频的获取变得非常容易。在网络上只要搜索百度视频、优酷视频、搜狐视频等，就可以找到许多与我们教学相关的视频。在喜马拉雅FM、酷听网、520听书网、有声世界网、酷狗音乐、网易云音乐等，都可以下载到我们需要的教学音频资源。不过这些下载的资源大多需要进一步处理，大多数音频和视频都偏长，我们的课堂教学内容其实只是需要其中的一小段，这就需要把视频进行剪辑。另外，由于播放设备对音视频格式的要求不同，我们对下载的音频和视频的格式也需要进行转换，只有音视频的格式符合播放设备对格式的要求，才能在课堂上正常播放。有些老师下载的音视频在课堂上播放不出来，大多数情况下，就是下载的音视频格式和播放设备要求的格式不匹配造成的。

语音视频第2篇

关键词：语音视频交流；传统二语课堂教学；二语习得

1 研究目的

本文试图研究传统的第二语言一对一授课课堂的语言交流与通过skype软件进行的语言交流的差异，从中发现这两种交流方式对学习者习得以及对教师教学行为的影响，并讨论两者的利与弊。本研究的目的是通过对这两种二语交际的描述、解释与比较，探讨语音视频交际的可推广性。

为此本文设立了如下三个具体的研究问题：

教师在单班课与语音视频教学中的提问频率与改错是否存在差异？

学习者在单班课与语音视频教学中的主动提问频率是否存在差异？

学习者对单班课与语音视频教学的评价是否存在差异？

2 研究方法

2.1 参加者

本研究的参加者包括八名2013年春季在北京美国各大学联合汉语中心（associated colleges in china， acc）留学的美国大学习者。acc成立十余年以来，以其高强度、高标准的课程设置以及只说中文的语言誓约（language pledge）而著称。同时为了实现高度个人化的教学，acc每天设置一堂50分钟到80分钟的一对一课程，称为“单班课”。在单班课课堂上，学习者有大量的机会与教师展开讨论，进行互动。

本研究的研究对象大部分（ 87.5%）为20与21岁，（平均年龄=20.7， sd = 0.5463）；均以英文为母语。75%的学习者在来中国留学之前接受过一至两年的大学程度中文正规教育。可以说，本次研究的研究对象具有非常相似的背景。

2.2 研究程序

本研究采用录像、录音以及调查问卷的方式收集数据，所有录像、录音收集数据的工作在2013年2月完成。参加者填写调查问卷的时间没有限制，大致在十分钟之内填写完毕。

2.3 研究材料

单班课录像材料与语音视频交际录音材料

单班课的录像资料来源于学习者与任课教师的真实课堂录像，教师与学习者的讨论内容均按照当天的授课进度严格执行。当天下午，同一个学习者与同一位任课教师利用skype语音视频软件进行30分钟的讨论与互动，讨论的主话题与当天上午单班课的相同。从这些录像与录音材料中，我们得到了如下变量：

1 教师在单班课与语音视频教学中的行为变量：

a.教师提问频率 the frequency of teacher’s questions.

b.教师改错频率 the frequency of teacher’s corrections.

2.学习者在单班课与语音视频教学中的主动提问频率 the frequency of student’s initial questions.

调查问卷

调查问卷请学习者就他们所经历的单班课与语音视频课在如下方面分别给予评价：

1.听力理解

2.自我表达

3.师生互动

4.教师改错

此外，学习者被要求用文字形式回答他们更喜欢哪种授课方式，同时给出理由。

3 研究发现

研究问题1：教师在单班课与语音视频教学中的提问频率与改错频率是否存在差异？

本研究对教师提问频率与教师改错频率变量实现配对样本t-test后获得结果如下（见表一、表二）：

如表一、表二所示，两组的t-test结果差异不显著（sig. of t >α 值0.05），此外该两组变量的置信区间包含零数值。由此得出结论，教师无论在单班课上或是语音视频教学中的教学提问频率与改错频率无显著差异。

研究问题二：学习者在单班课与语音视频教学中的主动提问频率是否存在差异？

本研究对学习者主动提问频率变量实现配对样本t-test后获得结果如下（见表三、表四）

如表三、表四所示，该组的t-test结果差异不显著（sig. of t >α 值0.05），此外该组变量的置信区间包含零数值。由此得出结论

，学习者无论在单班课上或是语音视频教学中的主动提问频率无显著差异。

研究问题三：学习者对单班课与语音视频教学的评价是否存在差异？

本研究对学习者给予的单班课与语音视频教学的评价实现四对配对样本t-test后获得结果如下（见表五、表六）

如表五、表六所示，第一组及第三组的t-test结果差异显著（sig. of t <α 值0.05），此外该两组变量的置信区间不包含零数值。由此得出结论，学习者对单班课与语音视频课堂上的听力理解、师生互动评价的差异显著，而对自我表达与教师改错的评价差异不显著。

4 讨论与结语

以上三个研究问题的数据分析显示，教师在单班课与语音视频授课时，他们的提问频率与改错频率没有统计学意义上的差异，也就是说，同一位教师保持了相似的教学与交际行为，并未因为语音视频这种远程的交流环境而减少自己对学习者的提问数量或者改错的次数。学习者的主动提问频率在这两种课堂中的差异也不显著，并不因为缺少了面对面的真实交际环境而不愿意主动向老师提问。

在比较单班课与语音视频授课时，学习者对语音视频交际过程中的听力理解与师生互动的评价均低于单班课（分别下降了1.6250与1.8750）；而对自我表达与教师改错的评价却无统计学意义上的差异。这说明在学习者看来，单班课在第二语言输入与互动上较语音视频授课更胜一筹，但是在自我表达与接受纠错方面，学习者并未感到明显的不同。

由此可见，虽然所有的学习者都声称他们更喜欢传统的面对面的一对一交流方式，然而本研究的数据显示教师的提问频率与纠错频率在单班课与语音视频授课时并无显著的差异，学习者的主动提问频率也保持了一致性。此外，学习者自我感知中的表达和对教师纠错的反应也无显著差别。因此，在面对面交流无法实现的情况下，语音视频授课不失为一种理想的二语交际手段，也可以成为对传统的二语课堂有益的补充。

参考文献

[1]brown， d. （2001）. teaching by principles： an interactive approach to language pedagogy. new york： longman.

语音视频第3篇

关键词：语音视频交流；传统二语课堂教学；二语习得

1 研究目的

本文试图研究传统的第二语言一对一授课课堂的语言交流与通过Skype软件进行的语言交流的差异，从中发现这两种交流方式对学习者习得以及对教师教学行为的影响，并讨论两者的利与弊。本研究的目的是通过对这两种二语交际的描述、解释与比较，探讨语音视频交际的可推广性。

为此本文设立了如下三个具体的研究问题：

教师在单班课与语音视频教学中的提问频率与改错是否存在差异？

学习者在单班课与语音视频教学中的主动提问频率是否存在差异？

学习者对单班课与语音视频教学的评价是否存在差异？

2 研究方法

2.1 参加者

本研究的参加者包括八名2013年春季在北京美国各大学联合汉语中心（Associated Colleges in China， ACC）留学的美国大学习者。ACC成立十余年以来，以其高强度、高标准的课程设置以及只说中文的语言誓约（language pledge）而著称。同时为了实现高度个人化的教学，ACC每天设置一堂50分钟到80分钟的一对一课程，称为“单班课”。在单班课课堂上，学习者有大量的机会与教师展开讨论，进行互动。

本研究的研究对象大部分（ 87.5%）为20与21岁，（平均年龄=20.7， SD = 0.5463）；均以英文为母语。75%的学习者在来中国留学之前接受过一至两年的大学程度中文正规教育。可以说，本次研究的研究对象具有非常相似的背景。

2.2 研究程序

2.3 研究材料

单班课录像材料与语音视频交际录音材料

单班课的录像资料来源于学习者与任课教师的真实课堂录像，教师与学习者的讨论内容均按照当天的授课进度严格执行。当天下午，同一个学习者与同一位任课教师利用Skype语音视频软件进行30分钟的讨论与互动，讨论的主话题与当天上午单班课的相同。从这些录像与录音材料中，我们得到了如下变量：

1 教师在单班课与语音视频教学中的行为变量：

A.教师提问频率 The frequency of teacher’s questions.

B.教师改错频率 The frequency of teacher’s corrections.

2.学习者在单班课与语音视频教学中的主动提问频率 The frequency of student’s initial questions.

调查问卷

调查问卷请学习者就他们所经历的单班课与语音视频课在如下方面分别给予评价：

1.听力理解

2.自我表达

3.师生互动

4.教师改错

此外，学习者被要求用文字形式回答他们更喜欢哪种授课方式，同时给出理由。

3 研究发现

研究问题1：教师在单班课与语音视频教学中的提问频率与改错频率是否存在差异？

本研究对教师提问频率与教师改错频率变量实现配对样本t-test后获得结果如下（见表一、表二）：

如表一、表二所示，两组的t-test结果差异不显著（Sig. of t >α 值0.05），此外该两组变量的置信区间包含零数值。由此得出结论，教师无论在单班课上或是语音视频教学中的教学提问频率与改错频率无显著差异。

研究问题二：学习者在单班课与语音视频教学中的主动提问频率是否存在差异？

本研究对学习者主动提问频率变量实现配对样本t-test后获得结果如下（见表三、表四）

如表三、表四所示，该组的t-test结果差异不显著（Sig. of t >α 值0.05），此外该组变量的置信区间包含零数值。由此得出结论，学习者无论在单班课上或是语音视频教学中的主动提问频率无显著差异。

研究问题三：学习者对单班课与语音视频教学的评价是否存在差异？

本研究对学习者给予的单班课与语音视频教学的评价实现四对配对样本t-test后获得结果如下（见表五、表六）

如表五、表六所示，第一组及第三组的t-test结果差异显著（Sig. of t

4 讨论与结语

参考文献

[1]Brown， D. （2001）. Teaching by Principles： An interactive approach to language pedagogy. New York： Longman.

语音视频第4篇

【关键词】语音视频编码遥测

1 引言

在飞行试验中，为了掌握试验机的人机工作状态，飞行员与地面指挥员通过无线电台进行语音交流传递信息，这种半双工的“问、答”式工作方式易分散飞行员注意力，不利于试验任务的执行。如果将飞行员“全部语音”传输到地面，结合“问、答”方式，试飞工程师和地面指挥员就更容易全面的掌握试验机的工作状态。

同样机载测试的模拟视频遥测是将摄像头输出的视频信号直接调制发射传输到地面，一路视频信号占用一套遥测设备，非常占用资源。

为了解决上述问题，首次将语音视频信号同时采集，采用基于ADPCM和MPEG-4的数字编码方式[1]，通过IRIG-106标准的PCM数据帧将数据流实时遥测到地面站，地面站接收信号后通过软件解码实时还原出语音视频信号。

2 语音编码方案

2.1语音编码的概述

语音编码的方法有三种：波形编码、参数编码和混合编码。

波形编码能使重建语音波形保持原语音信号的波形形状，它具有适应能力强、语音质量好的优点，但所需的编码速率高，如脉冲编码（PCM）、自适应差分脉冲编码调制（ADPCM）等；参数编码通过对语音信号特征参数的提取及编码，保持了语音的语意，所需的编码速率比较低，但合成语音质量较差，如LPC-10、MPE-LPC；混合编码采用了合成-分析的方法，克服了参数编码的缺点，在中低速率上获得了高质量的语音编码，大大节省了传输信道容量及存储量，为不断拥挤的通信频带提供了一种解决方法，混合编码有CELP、LD-CELP、ASCELP 等编码方式。

另外，语音算法的选择除了压缩率外，更应该侧重低延时、低复杂度和语音的传输质量。

2.2基于ADPCM原理的语音编码原理

之所以要对语音进行压缩，因为语音信号本身的A/D转换会导致存储容量需求的增加及传送信道带宽的增加。如一段44.1KHz，量化精度为16bit的立体声语音信号，其一分钟占约10M的存储容量。如果直接用PCM码对之进行编码并存储和传输则存在非常大的冗余度，可对其进行4：1或16：1的压缩。

脉冲编码调制（简称：PCM）是使用最为广泛的调制方法。在PCM的调制过程中，将输入的模拟信号进行取样，量化和编码。这种方法通过用脉冲编码来代表取样后的模拟信号的幅度。语音信号通过PCM编码后得到的信号，最能够保持其真实度，但是其需要的存储空间及传输带宽也很大，所以就有了ADPCM语音编码技术，要了解ADPCM语音编码下面先介绍其他几种语音编码原理。（1）差分PCM编码原理。差分PCM（即DPCM）记录的不是信号的绝对大小而是相对大小，因为信号的相对大小变化比信号本身要小，码位用的也比较少。差分系统就是利用这种信息的冗余，不记录信号的绝对大小，而是记录相邻之间差值的大小。差分编码采用预测编码技术，从输入中减去预测值，然后对预测误差进行量化，最终的编码就是预测值与实际值之间的差值。解码器用以前的数据对当前样值进行预测。这种方法使用的比特数较少，但它的性能决定于预测编码方法以及它对信号的变化的适应能力。（2）增量调制（DM）编码原理。增量调制（DM）是一种特殊简化的DPCM，其只用1bit量化器，因为只用一个量化级来代表样值的变化，为了跟踪信号的变化，必须使用高的采样频率。在DM中，存在两类误差，一种是斜率过载误差，其产生原因是语音波形幅度发生急剧变化时，译码波形不能充分跟踪这种急剧的变化而产生的失真；另一种是颗粒噪声，因为在无声状态或信号幅值固定式，量化输出都呈0，1交替序列而产生的。（3）自适应增量调制（ADM）编码原理。一般情况下，颗粒噪声对音质的影响比较大，所以要对增量调制的的幅值取得足够小，但是取得足够小斜率过载失真就会比较大，为了减少失真就需要提高采样率，这样就会影响信息压缩的效果。所以为了解决上述问题，就出现了自适应增量调制（ADM），其原理为：在语音信号的幅值变化不太大的区间内，取小的值来抑制颗粒噪音；在幅值变化大的地方，取大的值来减小过载噪音。其具体实现方法为：在颗粒噪音不产生大的影响的前提下，确定最小的幅值。在同样的符号持续产生的情况下，将幅值增加到原来的2倍。即当+ 、+ 这样持续增加时，如果下一个残差信号还是相同的符号，那么再将幅值增加一倍，如此下去，并且确定好某一个最大的幅值上限，只要在这个最大的幅值以内同样的符号持续产生，就将幅值继续增加下去。如果相反，残差信号值为异号时，就将前面的幅值设为原来的1/2，重新以/2为幅值。

2.3 基于ADPCM原理的语音编码原理

自适应差分脉冲编码调制（简称为：ADPCM）用预测编码来压缩数据量。它结合了ADM 的差分信号与PCM的二进制码的方法，是一种性能比较好的波形编码。其根据语音信号具有短时平稳性的非平稳随机过程及相邻样点间有着很强相关性的特点，采用自适应量化和自适应预测技术对语音信号进行编码。它的一个重要特点就是可以在较低的数据率的情况下，获得较高质量的重构语音。

其核心思想为：（1）利用自适应的思想改变量化阶的大小，即使用小的量化阶去编码大的差值；（2）使用过去的样本值去估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。编码器和译码器都是根据前面出现的PCM 抽样值对下一个PCM抽样进行预测，然后在接受端再恢复成先前的PCM信号。所以，发送端只需要向接受端发送预测值与实际值的误差。由于正常情况下，这些误差的幅度要比原始信号的幅度小很多，所以，对此误差进行编码所需代码的位数要比对原始信号系统编码所需要的位数少很多，从而达到压缩的目的。

ADPCM编码方法之所以是一种比较好的编码，因为其虽然有着较好压缩率，但其音质也比较好（MOS值达到4.1，最好标准为5）。另外其算法延迟较小，实现简单，成本较低。

3 视频编码方案

视频编码技术是基于MPEG标准，MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩编码技术以减小时间冗余度，利用DCT技术以减小图像的空间冗余度，利用熵编码以减小信息表示方面的统计冗余度。这几种技术的综合运用，大大增强了压缩性能。

MPEG标准主要有以下五个：MPEG-1， MPEG-2， MPEG-4， MPEG-7和MPEG-21等。这些编码技术都是很成熟的技术，在我们的方案中，对具体原理部分我们就不加以叙述，我们会比较下各种编码的优缺点，然后选择一种编码方案作为我们系统的编码方案。

3.1 基于MPEG-4视频压缩

在本系统中，我们选择MPEG-4编码技术作为我们的视频编码方案，因为在之前的MPEG-1，MPEG-2等都是采用第一代压缩编码技术，着眼于图像信号的统计特性来设计编码器，第一代压缩编码方案把视频序列按时间先后分为一系列帧，每一帧图像又分成宏块以进行运动补偿和编码，这种编码方案存在以下缺陷：（1）将图像固定地分成相同大小的块，在高压缩比情况下会出现严重块效应，即马赛克效应；（2）不能对图像内容进行访问，编辑和回放等操作；（3）未充分利用人类视觉系统特性。

MPEG-4采用了新一代视频编码技术，它在视频编码发展史上第一次把编码对象从图像帧拓展到具有实际意义的任意形状视频对象，从而实现了从基于像素的传统编码向基于对象和内容的现代编码的转变，其核心编码技术是基于AV对象（AVO，Audio visual object）的编码、存储、传输和组合。

3.2 MPEG-4视频压缩关键技术

MPEG-4除采用第一代视频编码的核心技术外，还提出了一些新的有创建性的关键技术，并在第一代视频编码技术基础上进行了卓有成效的完善和改进，其关键技术有：（1）视频对象提取技术：MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来，然后针对不同对象采用相应编码方法，以实现高效压缩，因此视频对象提取即视频对象分割，是MPEG-4视频编码关键技术，也是新一代视频编码的研究热点和难点。（2）VOP视频编码技术：VOP（视频对象平面）是MPEG-4编码的核心概念，其在编码过程中，针对不同VO采用不同的编码策略，即对前景VO的压缩尽可能保留细节和平滑，对背景VO采用高压缩率的策略。这种方法不但克服第一代视频压缩中的方块效应，也提高了压缩比。（3）运动估计与运动补偿技术：MPEG-4采用I-VOP，P-VOP，B-VOP三种帧格式来表征不同的运动补偿类型。它采用了H.263中的半像素搜索技术和重叠运动补偿技术，同时又引入重复填充技术和修改块（多边形）匹配技术以支持任意形状的VOP区域。

4 语音视频实时遥测系统的实现

通过上面的叙述，我们知道原始语音信号和视频信号的实时遥测非常占用资源，所以我们需要对其进行编码并压缩。在本方案中，视频压缩支持三路复合视频中的一路或者一路S-端子视频输入信号进行采样编码成数字信号，然后利用MPEG-4编码模块进行视频信号的压缩。同时可以接受另外一路通过ADPCM编码原理进行压缩的语音信号，以实现语音视频编码的混合。

MPEG-4视频信号和ADPCM语音信号同时进入到MPEG-2模块形成一个MPEG-2传输流，一个MPEG-2传输流是某些固定长度（188字节）的数据包。将这些数据包按照数据采集单元的底板接口通信协议分解成16位字，以参数形式插入到标准的IRIG-106 PCM数据帧中并进行遥测。

地面接收站接收到遥测信号后，通过地面解调设备和软件将语音信号和视频信号从PCM流中实时解调还原出来供地面人员监控。其系统框图如图1所示。

5 结语

通过对语音视频信号进行数字编码，经机载测试系统的遥测发射机进行遥测发射，这样既减小了带宽，又能使多路视频信号通过一条PCM流遥测下来；且语音信号的ADPCM码可以加入到视频信号的MPEG-2流中，进行混合编码，这样大大提高了效率，也节省了硬件资源。

按现有飞机的实施方案，1路语音加视频信号进过PCM编码后的位速率1.5Mb/s左右，而现有的机载测试系统PCM遥测发射机的遥测带宽有10Mb/s，这样1路遥测系统可以遥测6路视频加语音信号，如果用传统模拟视频发射机就需要6路遥测系统，且飞行员语音还要单独外通过无线电台方式与地面交流。

该方案经过系统调试和飞行试验，能够实现语音和视频信号的同步。采用该方案，使用一套PCM遥测系统可以遥测多路语音视频，大大节约了硬件资源和成本。

参考文献：

[1]廖广锐，刘萍.基于ADPCM语音压缩算法研究[J].计算机与数字工程，2007，第7期.

[2]林志锋，黄华灿，李学等.ADPCM语音压缩编解码器的FPGA实现[J].数字信号处理，2009，第33卷第5期.

语音视频第5篇

关键词：数字视频；TTS；SpeechSDK；讲解

中图分类号：TP315 文献标识码：A文章编号：1006-4311（2012）08-0117-02

0引言

盲人因特殊的视觉障碍，无法欣赏影视艺术。当一个盲人观看电影时，必须有一个人随着剧情的发展给他讲述故事情节的发展。美国教授格雷戈里・弗雷泽对此感触很深，于是他创造了一种描述影像的理论：听视法。这种方法就是把人物、光线、布景、空间和场景分解，与对话进行同期录音。有了这套听视系统，盲人戴上一个装有红外线的头盔就可以独自一人去看电影了。

国内，还没有专门针对盲人研制类似的系统。2004年，北京的王伟力（又被亲切地称为大伟）开办“心目影院”，做盲人的眼睛，通过其娓娓道来的讲述，让盲人朋友看到精彩的电影。“心目影院”的故事经新闻联播报道后，在全国各地引起强反响，各地涌现出了许多类似的“心目影院”。

无论是国内或者国外的解决方案来说，均存在一定的不足，不便推广。

国外的视听系统需要相关的片源及硬件播放设备支持，成本较高，不便推广。

国内的“心目影院”虽然对片源及硬件播放设备没有什么特殊的要求，但由于对影片讲解者的素质有较高要求，且对于欲讲解的影视节目，讲解者需提前观看、准备，讲解时又受讲解者自身时间、地点、体力等因素制约，不能满足盲人朋友即时、个性化的影视欣赏需求。

目前，互联网宽带已进入千家万户，大街小巷网吧遍布，宽带影视伸手可及。而TTS语音合成技术又相当成熟，我们完全可以借助TTS语音技术实现宽带影视作品的自动讲解，也就是说利用TTS语音技术来代替“心目影院”的讲解者，来实现宽带影视作品的计算机自动讲解。

1TTS语音技术

TTS（Text-to-Speech）语音合成又称为文语转换，是指计算机可以自动把输入的文本信息转换成语音的技术[1]。Microsoft、NeoSpeech等均推出了技术成熟的SDK开发包，Microsoft Speech SDK（5.1）开发包提供了英文语音合成引擎（TTS），支持C++、VB及Web编译开发环境，中文、日文的语音合成引擎需要另外下载安装SpeechSDK51LangPack.exe文件。[2]比较而言，NeoSpeech提供的中文Lilly（女声）、Wang（男声）语音库，更为丰富，最为流畅。考虑到Microsoft windows操作系统的市场覆盖面及NeoSpeech语音库的流畅性，我们采用Microsoft Speech SDK 5.1开发包与NeoSpeech的Chinese（Lilly、Wang）语音库相结合的技术来进行本系统的开发。

系统调用ActiveXObject对象，通过var VoiceObj=new ActiveXObject（"Sapi.SpVoice"）方法产生Sapi SpVoice对象VoiceObj。VoiceObj对象使用后，通过delete VoiceObj方法清除VoiceObj对象。VoiceObj对象通过VoiceObj.GetVoices().Item（i）方法取得语音引擎的Item序列号，通过VoiceObj.Voice方法设置语音引擎的具体类别（英文男声、英文女声、中文男声、中文女声等），通过VoiceObj.Rate方法设置或取得语音的语速，通过VoiceObj.Volume方法设置或取得语音的音量大小，通过VoiceObj.Speak方法进行文本到语音的转换输出。

影视作品播放时，是按顺序一个画面一个画面显示，这一个画面称为一帧。我们可以对影视作品进行“视听转换”处理，建立起影视作品的“视听转换”信息数据库，保存相关帧的需要讲解的文本信息。播放控制单元利用TTS语音合成技术，在相应帧位置处播放相应的“文本信息”，完成影视节目的“视听转化”，从而来实现宽带影视作品的自动讲解。

2需求分析

系统参与者包括常人即视力正常的明眼人，以及盲人用户。常人可根据盲人朋友的需要，进行个性化的语音设置、音量设置、语速设置等系统设置。盲人朋友选择视频，播放视频，系统根据相应的语音、音量、语速等系统设置，对盲人朋友选择的数字视频进行在线语音自动讲解，实现系统功能。系统总体用例图如图1所示。

3系统设计

FLV是随着Flash MX的推出而发展起来的一种新兴视频格式，它的文件小，加载速度快，FLV视频是当前互联网视频的主流视频格式文件。为支持FLV视频格式，系统通过Adobe Flash CS4技术，将选择欲播放的视频功能封装在一个flash文件flvplay中，系统参与者即盲人用户仅需通过上、下方向键即可选择欲播放的视频，并向web窗体发送FSCommand消息[3]。web窗体通过Internet Explorer 的挂钩及DoFSCommand（command，args）处理 Flash 影片中的所有 FSCommand 消息，调用VoiceObj.Speak方法输出语音提示信息，告知盲人用户当前所选择的视频的名称，盲人用户可通过回车键，播放所选择的视频。播放过程中，flvplay向web窗体发送当前视频帧的帧数据FSCommand消息。web窗体通过Internet Explorer 的挂钩及DoFSCommand处理获取的当前视频帧的帧数据FSCommand 消息，在数据库中检索对应的讲解文本，调用VoiceObj.Speak方法输出即时讲解语音，实现系统功能。系统总体程序流程图如图2所示。

4系统实现

NET Framework是微软用于Windows的新托管代码编程模型，它将强大的功能与新技术结合起来，用于构建具有视觉上引人注目的用户体验式的应用程序，实现了跨技术边界的无缝通信，并且能支持各种业务流程。本系统即采用.省略结合jsp、JavaScript、ajax、flash等技术，配合SQL数据库，完成系统功能。相关程序代码如下：

var currentP=Math.floor(document.all.item("curpos").value);

if (document.all.item("MdbString").value != "跳过"){

if ((document.all.item("MdbString").value=="") ||

(StartFlag=document.all.item("MdbStart").value!=document.all.item("volstart").value )){

if ((document.all.item("MdbStart").value

(document.all.item("MdbEnd").value>= currentP)){

StartFlag =document.all.item("MdbStart").value;

StopFlag=document.all.item("MdbEnd").value;

SpeakStr=document.all.item("MdbString").value;

if (document.all.item("MdbString").value == "跳过"){}

else{

VoiceObj.Speak( SpeakStr,0);

VoiceObj.Speak( "", 2 );

SpeakStr ="已读";

document.all.item("volstart").value= StartFlag;

document.all.item("volend").value=StopFlag ;

document.all.item("volstring").value=SpeakStr;

}}}}

5总结

数字视频在线语音讲解系统，在线播放flv视频，借助TTS技术，为盲人朋友动态语音讲解视频，做盲人的眼睛，满足盲人朋友即时、个性化的影视欣赏需求。

参考文献：

[1]袁嵩.一个TTS系统的实现方案.计算机工程与应用，2004，(21).

语音视频第6篇

1、手机微信视频聊天听不到对方的声音可能是声音没有开启,第三方音频冲突等原因导致。

2、如果视频聊天时,对方无法听到您的声音,建议进行以下操作: 若是拨打视频电话时: 1).切换到语音通话界面观察是否可以正常送话。 2).检查3G网络是否稳定。3).与其他联系人视频通话，观察通话时是否正常。4).更换其他时间段尝试。

（来源：文章屋网）

语音视频第7篇

文章结合我校大学英语网络教学改革已进行到中期阶段的背景，依据相关的外语习得及教学理论，结合课题的研究内容与目标，对我校正在开发的大学英语音视频资源库进行详细论述及深入探讨。以资源的准确性、实用性、完整性、可扩展性为标准，对教学资源科学分类整合，构建音视频资源库平台，服务于学生的自主学习，提升学生英语学习的兴趣与效率，强化他们的自主学习能力。并对后续存在的问题进行了探究，提出可行的解决方案。

关键词

教学改革；自主学习；资源库；开发；应用

0引言

我校在过去10年推行了大学英语网络化教学改革，投入数百万元建成了13个网络型语音室，构建了完善的英语自主学习环境，硬件设施在省内遥遥领先，但在软件资源建设及后续投入上却乏力。仅创建了网络英语学习平台主页，链接了外教社的新理念学习平台，但网站里内容不够充实，大多是一些外链资源，缺乏实用性和自主性，对学生没有吸引力。为了构建完善的大学英语自主学习与教学网络资源库，进一步推进大学英语教学改革进程，课题组成员拟用两年时间完成大学英语音视频资源库的开发和建设，根据师生应用中的反馈意见，积极改进各项功能，完善资源库。

1资源库开发的理论基础

自主学习是以学生作为学习的主体，通过学生独立地分析、探索、实践、质疑、创造等方法来实现学习目标，培养学生搜集和处理信息的能力、获取新知识的能力、分析和解决问题的能力以及交流与合作的能力。基于这一观点，笔者认为大学英语的自主学习应是给予每个学习者理想的外语学习环境，通过教师的引导，充分调动每个学习者的主动性，最终达成英语学习的目标。而理想的外语学习环境，就目前我校大学英语教学改革的现状，首要任务就是完善自主学习中心，开发建设大学英语音视频资源库。美国著名语言教育家克拉申（Krashen）认为：只有当习得者接触到“可理解的语言输入”（comprehensiveinput），即略高于他现有语言技能水平的第二语言输入，而他又能把注意力集中于对意义或对信息的理解而不是对形式的理解时，才能产生习得，理想的语言输入应具备可理解性、有趣又相关、足够的输入量等特点。大学英语音视频资源库的建立正是为了最大限度地为我校学生提供英语语言学习材料和实践机会，接触真正的西方社会与文化，使他们能广泛而有效地获取英语语言知识、从而提高语言习得能力，真正实现“有效地输出”。

2资源库开发的重要性

2.1发展自主学习中心的需要

目前国内各高校自主学习平台主要由两种路径形成。一是从出版社直接购买的学习平台，另一个则是各高校自建的资源库。前者可以通过学校资金和人力的投入，短期内则可以投入使用，形成效果。但校本音视频资源库的建设是一个长期的过程，需要课题组的持续努力。通过建设有特色的自主学习资源库，才能为学生的自主学习创造更好的条件，适应网络化、个性化英语教学的需要。

2.2有利于提升英语学习兴趣、提高学习效率

外语教学的最终目的是培养应用语言进行有效交流的能力。英语音视频资源辅助教学及应用于自主学习，不仅有利于语言习得的发展，而且为学生提供大量运用语言的机会，实现跨文化交流，音视频是了解西方文化的最好媒介。

2.3丰富教学方式，实现教学创新，提升教师的教育技术水平

互联网+风潮要求我们教师既要更新教学观念，又要在课堂教学模式、教学内容上进行创新。建设英语音视频资源库过程中可以充分调动老师们的积极性，形成良好的教学创新氛围；通过自学等途径提升了现代教育技术水平，丰富了教学方式。

3建设大学英语音视频资源库的方法与途径

资源库的建设管理是一项持久而庞大的工程，需要课题组成员通过各种渠道搜集各类资源，进行分类整理，同时需要不断提升现代教育技术水平。在学院领导及相关部门的大力支持下，赣南师范大学的英语音视频资源库已基本建设完成，并投入使用一年多，在师生中产生了非常好的反响。我们主要通过以下方法与途径进行资源库的开发与建设：（1）数字化各类英语教材。各类教材是英语教学的主要教学资源，它们也是英语学习者的首选材料，具备较好的权威性及广泛性。数字化英语教材，就是把各类英语教材附带的光盘、磁带转换成能在计算机上保存的音视频文件，存贮在服务器上，从而实现网络化共享。在数字这些素材时，既要考虑到教材的完整性，也要充分考虑到学生自主学习时的易用性，根据用途及层次对听力材料进行分层管理，文件命名均采用见名知义的命名方法，使师生在调用时简单易懂，实现快捷访问、高效利用。（2）自主开发点播系统，入库优质资源。视频资源比音频资源更加直观、形象，是学生首选的学习素材。在我校现代外语教育技术应用与研究中心的指导帮助下，我们自主设计开发了英语视频点播系统，内容涵盖：①各种英语视频课程：如学校自建的精品视频公开课和师生的英语教学竞赛视频，全球知名大学的视频公开课。②流行英语学习课程：如“走遍美国”、“空中英语教室”等。③主流英语媒体节目，如中央电视台英语频道，ABC美国广播公司，CNN广播公司等节目源。④英语演讲视频：如CCTV杯英语风采大赛，TED演讲集、经典演讲视频等。⑤影视资源：我们搜集整理了各类影视经典资源，包括奥斯卡历年最佳影片、IMDB最佳影片top250等优质影视资源。从实际应用情况来看，该资源是学生点击率最高的版块，可见其受欢迎程度。（3）购买适合教学与自主学习的音视频资源目前教育资源市场上针对英语学习方面的资源库是越来越多，为了与硬件设设相配套，完善我校英语网络教学与自主学习环境，我校近些年加大了对软件建设的投入，购买了一些重点资源库，涵盖英语学习、考试及出国留学等音视频资源，主要包括外语自主学习资源库、新东方多媒体学习库、环球英语网络、Fif外语学习资源库和部分试用资源库，极大地丰富了英语教学与自主学习资源，完善了英语网络学习环境。（4）制作音视频资源导航页，从互联网上下载相关打包资源。互联网是英语学习、教学的宝藏，里面有非常丰富、完整的各类英语音视频学习、教学资源等待我们去挖掘整理，如乔丹NBA经典比赛视频合辑、经典足球比赛欣赏、伦敦奥运会开幕式、老鹰乐队澳大利亚告别演唱会等经典高清英语资源，由于视频格式和播放器的局限性，我们通过迅雷等下载工具直接打包下载到服务器上，然后再制作资源导航页，让学生通过下载到本地的方式进行欣赏，这样既减轻了服务器的压力，也使学生有更多时间去慢慢领会其中所包含的文化价值意义。

4资源库的应用

有了英语音视频资源库，教师可以直接调用资源库中的教学资料进行课堂教学，有了英语音视频资源库和其它配套的学习系统，教师可以根据不同专业学生特点，采取灵活多样的教学，选择与其专业相符的教学内容，实行因材施教，把专业学习与英语学习有机结合起来，实现共赢。基于这些丰富、完整的数字化资源，学生们可以根据自己兴趣爱好和专业特点，在网络型语音室或寝室在线自主学习，选择合适的学习内容，按照自己的进度安排学习，实现高效利用时间，最终使学生具备较强的自主学习能力，养成良好的自主学习习惯。

5结束语

通过教学实践证明，有了基于本校实际的大学英语音视频资源库，给老师与学生带来非常大的学习能动性。教师可以充分利用起网络语音室的各项功能，进行教学改革创新，施行因生、因材施教，提高课堂教学效率，最大化地转化学习效果。同时，基于校园网的学生在线自主学习，通过选择与自己水平、兴趣相当的学习素材，真正实现自己学习、主动学习，充分激发了学生的求知欲望，打破课堂局限，通过网络互动有利地建设了第二课堂，使学习延伸到课外生活中去，从而使学生真正具备较强的自主学习能力，实现培养目标。但我们的研究也存在一些需要改进的问题。比如随着智能手机在学生中的普及，需要我们将资源进行转换，以适应安卓、苹果手机上的使用，这对我们的技术提出了新的挑战；另外，老师和学生才是资源的真正使用者，对如何选材、使用效果及如何改进等方面最有发言权，课题组应及时与他们进行沟通、问卷调查，进一步完善资源库，实现更广的社会传播价值。

作者：赖艺刘忠平单位：赣南师范大学外国语学院

参考文献

[2]零月秀,李波.大学英语听说教学数字化资源库的建设[J].通化师范学院学报,2004.25(1):106-108.

[3]莫锦国.大学英语自主式教学资源库开发初探[J].外语电化教学,2005(102):36-39.

[4]教育部高等教育司.大学英语课程教学要求[M].北京:清华大学出版社,2007:18-25.

[5]门斌.大学英语多媒体网络教学资源库的建设[J].电化教育研究,2009(7):68-72.

[6]甘玲玲.大学英语自主学习：校本网络资源库的开发[J].百色学院学报,2009.22(6):104-107.

[7]海霞.新疆大学英语教学网络资源库建设调查报告[J].新疆广播电视大学学报,2011(3):54-56.

[8]郭继荣,戴炜栋.大学生英语自主学习评价实证研究[J].外语界,2011(6):79-87: