东森平台:媒体认知中的人工智能技术教学方法研究
2020-03-25 14:05 作者:宣传处 浏览次数:
东森游戏资讯:

电子信息科学和技术基于物理学和数学。它研究通过电子形式表达和操纵信息的基本规律,以及使用这些基本规律来实现各种电子系统的方法。今天,进入电子时代和信息社会,电子信息科学技术已经渗透到各个领域。随着电子信息技术的飞速发展,电子信息教学领域也面临着新的挑战,有必要培养具有全面视野和出众能力的新一代工程师和领导者。为了实现这一目标,清华大学电子系从2008年开始进行课程改革,通过课程体系改革重新整合原有课程,梳理电子工程专业本科生的知识体系结构。从学科范式的角度出发,以理清新课程。本科课程体系形成了电子信息领域的学科图[1-2]。

AlphaGo在2016年击败李世石的事实再次证明了人工智能技术在世界上的潜力。传统的制造业和加工业以及新兴的互联网行业中的人工智能已经成为国内外主要公司以及学术界研究和开发的目标。 2016年底,Gartner全球峰会发布了《 2017年十大技术趋势报告》 [3],预测了2017年十大技术趋势,人工智能和机器学习,智能应用程序,智能事物,虚拟和增强现实,数字双胞胎东森游戏:,区块链和分配的分类帐,对话系统,网格应用程序和服务架构,数字技术平台,自适应安全架构。 Gartner预计,2017年全球60%以上的大公司将采用人工智能技术。

在2016年开设的媒体和认知课程的内容中,我们结合国内外许多著名学校的理论和项目内容,结合电子工程系的基本优势和创新成果,建立了一套媒体认知在这个领域里。人工智能技术教学课程的内容和平台,旨在获得人工智能技术中深度学习技术的基本理论和发展能力。通过为人工智能技术领域的高级专业人员提供必要的基本技能,专业知识和思维方法,本课程致力于向国际一流的科学研究和创新方向培养具有人工智能的专业技术人才。

2人工智能技术的教学内容

东森平台:媒体认知中的人工智能技术教学方法研究

美国麻省理工大学的统计学习理论与应用课程[4]致力于从统计学习和正则化理论的角度介绍机器学习的基础知识和最新发展。除支持向量机,流形学习,监督学习等经典机器学习方法外,它还着重于深度学习计算的理论框架,并要求学生根据项目形式提供机器学习和深度神经网络。解。

美国CMU大学的DeepLearning课程[5]通过一系列研讨会和课程实验介绍了深度学习的主题,涵盖了深度学习的基础知识,基础理论和应用领域,以及最新的问题。大规模数据学习。通过许多实验主题,学生可以对深度神经网络的原理和应用有更深入的了解。

美国斯坦福大学的“自然语言处理深度学习”课程[6]提供了对自然语言理解中前沿学习的深入研究。它讨论了非常新颖的模型,包括循环神经网络,长期和短期记忆模型,递归神经网络和卷积神经网络。通过动手实验,学生将学习使用神经网络技能来解决实际问题,包括实施,培训,调试,可视化和呈现自己的神经网络模型。最终的实验项目涉及复杂的循环神经网络,并将应用于大规模自然语言理解的问题。

东森平台:媒体认知中的人工智能技术教学方法研究

媒体认知课程是指上述著名课程的理论内容和项目特点。结合电子工程学系在人工智能领域的基础,优势和创新成果,设计开发了一套基于探索性的前沿媒体认知教学内容和基于人工智能技术的实验平台,旨在建立国际水平。人工智能技术教学课程内容。

3深度学习技术发展概述

传统的人工智能系统通常采用机器学习技术,这些技术在处理自然数据的原始形式方面能力有限。通常的困难在于如何将原始数据转换为适当的内部表示或特征向量。近年来,深度学习已受到人工智能行业的广泛关注。这是一种表示学习方法。由于其能够逼近任何非线性函数,深度神经网络(DNN)及其派生类,因此各种神经网络结构都具有取代传统模型的能力,并且可以在语音,图像,文本和语音等各种媒体的内容识别系统中发挥作用视频。

著名的人工智能科学家Yann LeCun于2015年在《自然》上发表了一篇文章[7],指出深度学习允许由多个处理层组成的计算模型学习如何表征具有多个抽象级别的数据。这些方法大大改善了语音识别,视觉识别,目标检测以及许多领域的技术水平,例如药物发现,遗传学等。深度学习通过使用反向传播算法指示机器如何更改其内部参数来发现大数据集的复杂结构,这些内部参数是根据深度神经网络上一层的表示来计算的。深度卷积网络在处理图像,视频,语音和音频方面带来了突破,而递归网络为诸如文本和语音之类的顺序数据提供了解决方案。

递归网络可以被视为深度前馈网络,其中所有层共享相同的权重。递归网络的问题在于,很难长时间学习和存储信息。为了解决这个问题,提出了一个长短期记忆(LSTM)模型网络。主要特征是其存储单元在下一个权重值为1的时间段内与其自身连接,因此可以在复制其自身状态时对其进行累加。除了这种自连接之外,另一个单元还学习了外部信号,以确定何时清除此类信息。在语音识别和机器翻译应用中,长期和短期记忆模型已被证明比传统的递归网络更有效。

4基于深度学习的语音识别教学项目在对上述课程和支持项目进行详细研究的基础上,结合现有研究和平台,我们构建了一个基于深度学习的连续语音识别项目平台,包括两个主要项目。深度神经网络语音识别项目和东森平台:长期和短期记忆模型递归神经网络语音识别项目。

4.1深度神经网络语音识别项目

典型的深度神经网络语音识别模型[8-9]的核心是对声学特征执行多层转换,并在同一网络中优化特征提取和声学建模。神经网络可以通过非线性激活函数拟合任何非线性函数。原始声学模型中的高斯混合模型可以用神经网络代替,以计算每个帧特征与每个音素的相似性。深度神经网络原理的结构示意图如图1所示。

图1表示具有三个隐藏层的深层神经网络。在两个相邻层的每个层中,每个层的每个节点都单向连接到另一层的所有节点。数据从输入层输入,并逐层传播到下一层。对于节点之间的连接权重,采用BP算法。对于给定的输入和输出训练数据,BP算法首先通过前向传播从输入中获取输出,然后通过实际输出与理论正确输出之间的差以及从输出层到输入层的距离来获得残差根据激活功能和连接权重。对残差进行反向传播,计算每个节点与理想值之间的残差,最后根据每个节点的残差校正节点之间连接的权重,并通过调整权重来实现训练,因此以更接近理论输出。

当DNN实际上用于语音识别的声学模型中时,其结构如图2所示。深度神经网络的输入层通过网络中的前向传播,输入从每个音频帧中提取的特征。邮政爸爸的输出《《ΣΣ》《《《《《》相似相似相似相似相似相似相似语音识别。考虑到DNN没有存储特性,并且语音信号甚至处于音素级别,因此前后存在相当大的联系。为了提高DNN在处理前后的高度相关语音信号中的性能,通常选择同时使用当前帧的前后部分帧作为网络输入,从而提高DNN的正确率。当前的帧识别。

在语音识别中将长期和短期记忆模型应用于声学模型的想法类似于深度神经网络[10-11]的想法,它取代了高斯混合模型来计算语音之间的匹配度。输入框和每个音素。其原理是首先根据输入门判断输入数据在存储单元中所占的比例,而遗忘门确定存储单元遗失的比例。然后将存储单元剩余的存储部分和新输入的部分相加,作为存储单元的新存储值。根据输出门控制获得新的存储器值,并且通过递归投影层减小存储器单元的输出。降维后的结果一方面用作三个控制门的反馈,另一方面用作网络的输出;非递归投影层仅用作最终输出的补充,而不会影响控制门。当长期和短期记忆模型实际用于语音识别的声学模型时,其结构如图3所示。

与深度神经网络不同,长期和短期记忆模型递归神经网络由于具有记忆特征而无需额外的多帧输入,只需输入当前帧即可。然而,考虑到语音之前和之后的相关性,通常对输入语音帧进行时移,从而基于已知的未来部分帧的特性来执行针对t时间帧的特征计算的输出结果,从而提高准确性。学位。

5结论

我们在媒体和认知课程中引入了深度学习教学项目“基于深度学习的语音识别教学项目”。在现有开发平台的基础上,我们介绍了多种深度学习算法,并进行了比较,以使学生精通。当前主流的深度学习算法的核心技术和应用方法。学生的反馈表明,通过这部分教学内容,学生加深了对深度学习技术的理解,并调动了研究热情。大多数学生对深度学习的前景非常乐观。通过将这些内容与媒体认知教学课程相结合,为学生提供研究平台,学生可以拓宽研究视野,进一步为培养学术兴趣,明确科学研究方向和坚定的科研信念提供支持和支持,并最终通过国际领先的研究水平。同时,它的目的是强调创新实践的能力和不断探索的精神。接下来,我们将基于深度学习项目平台进一步开展研究和探索,以提高深度学习的实时性和鲁棒性。




如是转载,请注明本文地址:http://www.lixiaoxuebao.com/rfg/gongsidongtai/20200325/939.html
上一篇:利用信息环境提高中等职业学校数学教学的效率
下一篇:湖南省农业保险发展的问题与对策