第10章 电子声带(1 / 2)

谢晋不知道楼清焰是怎么发现自己心思的,不过,老实说,他不太信对方的说辞。

或许只是在安慰他吧。

他当然不知道,地球确实不需要算法创新,因为现有的神经网络模型,其实就是强ai的初代技术。

星际世界出现的第一个强人工智能,是用神经网络一层层堆叠而成的。它本质上是一台不断学习的机器,从许多样本事件中归纳人类逻辑,将之写入数据库或算法。

当系统量级超过某个临界值,整个逻辑量就会极其庞大,涵盖人类所有思维方向,机器的行为模式也会无限接近人类。由此可以认为,量变引起质变,机器获得了自主思考的能力。

要想达到这个目标,人工构建的机器神经网络,必须拥有不下于人脑的体量。然而脑神经元数量何其庞大即使榨干超级计算机的最后一kb容量,也模拟不出这个结构。

地球需要硬件更新,光子计算机勉强符合要求,最理想的还是量子计算机。但是,量子计算机是个比强ai还大的泡沫,它的研发至少需要三个前提可控核聚变、脑域开发技术、基础科学突破。

至于为什么,解释起来太麻烦,楼清焰也不打算告诉谢晋。

谢晋没有纠结太久,很快就带他来到一台工作站前面。

“董事长,既然要看电子声带项目,不如先看一下deo吧。这个版本已经非常成熟,只要再完成一些优化工作,就可以投入市场营运了。”他在鼠标上点了一下。

音响里放出了一首歌,女孩子的声音特别甜美,音调有点怪异,衔接带有机械感,听着像是siri在唱歌。

不过,比起vocaoid系列已经非常自然了。

vocaiod,大名鼎鼎的语音合成软件,超人气偶像初音未来的诞生基础。

据说它最初是给音乐行业录制小样的,但是发行之后问津者寥寥。制作方一拍脑门,开了个脑洞“我们不做音乐软件,做虚拟歌姬。”由此,初音未来诞生,虚拟偶像概念进入人们的视线。

谢晋说“设计软件框架的时候,我们对比了几款竟品,其中最普及的是vocaiod和utau。它们的实现原理差不多,预先录制人声,对人声排列组合,再加上音调,组成一支歌曲。”

“我们扒了两款软件的框架,最后还是决定,放弃这种纯机械式合成,改为仿生式的。也就是基于机器学习算法的ai软件,我们把它命名为,电子声带。”

“因为没有先例,研发期非常困难,不过第一个版本出来之后,给了人相当大的惊喜。制作出来的成曲,最差也能达到歌姬级别。”他点了一下鼠标,对楼清焰说,“董事长,来听听它说的第一句话吧。”

音响里传出一个清朗的男声。

“heo,ord”

楼清焰顿时发现“这是我的声音”

“这是大家投票决定的。”谢晋揶揄地看过来。

不知为何,被点破心思之后,他反倒觉得楼清焰有点亲切。

“还行,挺自然的。”

“这是ai算法的功劳。”谢晋说,“我们设计了一种深度学习算法,软件会对音源库进行特征提取,用提取出来的特征信息进行训练,最终,为每组音源库生成独一无二的数据模型。基于这个模型,合成语音会自然许多。”

“这还不是最理想的。最理想的那种合成语音,不用组合人声,是凭借ai算法的高智能,凭空生成声音。不过”

“不过你们没这个技术。”楼清焰说。

他想了想,描述道“声音的本质是震动,在音响里就是膜片的震动,这种震动由电磁场引起,而电磁场的控制方式,是线圈通不通电。通电为1,不通电为0。”

“所以,计算机声音的本质是一串二进制数,是不同排列组合的1和0。这叫做数字信号。”

“最理想的语音合成,不是组合音节,而是直接组合数字信号。”

楼清焰“我说的对吗。”