基于 51 单片机的语音实时采集系统：功能强大，应用广泛

STC89C52该款单片机资源丰富，再加上与isd4004语音芯片的结合来实现语音的存储与回放，通过单片机的控制可以实现语音的多录多放的功能。由于单片机等微控制器的出现和数字电路技术的发展，使得现在的语音存储与自动播放变得易于实现。该系统是通过控制核心单片机来控制各个模块的工作。

1.1 研究意义

数字录音机是当今人们熟悉的产品，在很多地方都有使用，主要用户是记者。正是因为录音机的录音功能，当你记不住重要的对话或重要会议的重要内容时，它可以清晰完整地记录下你想要记录的内容，让你有更多的时间处理其他事情。再加上录音机体积小巧便于携带，存储容量大，基于这些优势，越来越受到人们的青睐。

我们现在说的录音笔，指的是数码录音笔，也叫数码录音棒或者数码录音笔，是数码录音器的一种，为了方便操作，提高录音质量，它的造型主要不是简单的笔形，方便携带，功能多样。

1.2 国内外研究现状对比

就录音而言，虽然专业的数码录音笔在录音时长和质量上都占有绝对的优势，但随着多功能MP3、MP4、PDA甚至智能手机的普及，录音逐渐成为便携数码设备的附加功能。虽然国内不少缺乏技术的小厂商纷纷退出数码录音笔市场，但以三星为代表的世界级数码巨头并没有宣告放弃，而是借助新技术和新设计，为这个看似停滞的市场注入了新的活力。

首先，录音是任何录音笔必不可少的基本功能，因此良好的音质成为了录音笔未来的发展方向之一。随着闪存技术的飞速进步，存储容量已经不再是数码录音笔发展的瓶颈，相反，容量过大又会显得有些无用。因此，精明的商家开始还原音质的魅力，并将其作为数码录音笔发展的一大方向。在此基础上，三星将其在家庭影院中的王牌3D音效技术DNSe运用到了数码录音笔产品中。这种音效增强技术与单纯扩大频率范围完全不同，也就是说，即使使用较小的频率范围来实现长时间的录音，也能获得优化的录音效果。DNSe是三星历时六年研发出来的虚拟声音技术，主要应用于家庭影院和高端MP3产品，它通过对声音数字信号的处理，能够营造出更加真实的临场感，听者可以清晰感受到声音来自四面八方，而且范围更远，声音更加纯净。搭载DNSe音效的三星YV-150不仅在录音方面拥有得天独厚的优势，其播放音乐的能力更是堪比专业MP3。值得注意的是，作为数码音乐领域的领军者，三星新一代DNSe 2.0音效技术已经开始在13等新品上亮相。而且，种种迹象表明，三星正试图通过音效升级，打造独特的市场竞争力。数码录音笔音质的全面提升或许只是时间问题。

其次，单有好的音质是不够的，未来的录音笔应该有更强大的功能。

专业数码录音笔之所以专业，是因为其功能更贴近商务人士的需求。如果要将录音笔录制的文件在其他数码设备上使用，以MP3格式保存最为方便，电脑、手机、MP3都可以轻松播放。三星YV-150可以将录音直接保存为MP3文件，大大方便了用户的使用。另外，对于经常出差的商务人士来说，三星YV-150是值得推荐的，其专业级的音效增强芯片将为音乐播放带来震撼的感受，让您在工作之余娱乐放松。

随着影音家电的不断丰富，越来越多的微型产品走进了人们的日常生活，其最突出的优点就是体积小、重量轻，给人们带来了便利。录音笔作为获取和记录数字文件的简易工具，深受市场欢迎，成为学生记者、商务人士购置录音设备的首选，不仅取代了校园里的复读机，也成为时间紧迫的上班族的新宠。

1.3 主要研究内容

语言在人类发展史上起着至关重要的作用，其作用丝毫不亚于直立行走和工具的使用。如何准确地记录人类的语言也是人们一直在思考的问题。随着人类社会的不断进步，数字信号处理技术的不断提高，语音处理大规模集成电路的进步，语音合成、语音识别、语音存储和回放技术的应用越来越广泛，自动化程度越来越高，应用范围越来越广，前景十分看好。另外，录放系统还具有电路简单、应用方便、单片机录放、不怕断电、音质纯正、性价比高等特点。

因此本设计采用单片机和语音芯片实现语音录音机系统。语音录音机最基本的要求就是能录音、播放、重复录音、播放。STC89C52单片机资源丰富，结合isd4004语音芯片实现语音存储和播放，通过单片机的控制可以实现语音多次录音、播放的功能。

第 2 章设计方案与组件介绍

2.1 系统总体设计

多功能录音笔的主要功能是实现语音存储和定时播放。实现语音存储和定时播放的方法有很多种，可供选择的设备也很多。由于单片机等微控制器的出现和数字电路技术的发展，语音存储和自动播放已经变得很容易实现。本设计采用单片机作为微控制器，选用字长为8位的STC89C52单片机作为控制器。

目前，可以与单片机配合使用的语音芯片很多，性能优异的语音芯片也不少。美国ISD公司生产的ISD4004语音芯片就是其中一种。ISD4004芯片采用CMOS工艺，内部含有振荡器、抗混叠滤波器、平滑滤波器、音频放大器、自动静噪和高密度多级闪存存储阵列。引脚包括电源、时钟、语音信号模拟输入/输出端、MCU接口（SPI接口）。该芯片采用多级直接模拟存储技术，每次采样值直接存储在片内闪存中，因此可以非常逼真、自然地重现语音。

ISD4004系列单片机的录音、放音时间为8～16分钟，采样频率可选4.0/5.3/6.4/8.0 kHz，频率越低，录音、放音时间越长，但音质会降低。芯片设计基于所有操作必须由单片机控制，通过串行通信接口（SPI或Microwire）送入操作指令。由于ISD4004的诸多优点，本设计采用它作为录音、放音设备。系统外接时钟芯片DS1302、中断键盘LCD1602显示器及E2PROM AT24CO2。为了提高录音时的声音质量，必须提高输入端的信噪比。因此本系统输入端采用三极管（9011）放大电路单端输入，系统输出端经音频功率放大器LM386放大输出，驱动扬声器。

如果录音笔只用于录音和播放，显得功能单一，所以要增加一个计时功能。如果用单片机内部的定时器作为计时，计时不够准确，反而浪费了单片机的资源。为此选用DS1302作为时钟芯片。该芯片是美国DALLAS公司推出的一款低功耗、高成本的实时时钟芯片。它价格低廉，电路接口简单，使用方便，含有主电源/备用电源双电源引脚，提供以涓流电流给备用电源充电的功能。它采用SPI三线接口与CPU同步通讯，可提供秒、分、时、日、周、月、年，当月份不足31天时自动调整，并有闰年补偿功能。

时间对于人们来说总是那么的宝贵，工作的忙碌和复杂很容易让人忘记现在的时间。在事情不是很重要的时候，忘记做无伤大雅，但是一旦重要的事情，一时的耽搁就可能酿成大祸。闹钟可以在一定程度上解决这些问题。既然可以录音，这次的设计在此基础上加入了自录语音信息，提醒人们该做什么。有时候闹钟一响，人们就会忘记自己该做什么。

语音芯片是设计的核心，对设计来说非常重要。可以与单片机配合使用的语音芯片有很多，性能优异的语音芯片也有很多。美国ISD公司生产的ISD4004语音芯片就是其中一种。ISD4004芯片采用CMOS工艺，内部含有振荡器、抗混叠滤波器、平滑滤波器、音频放大器、自动静噪和高密度多级闪存存储阵列。引脚包括电源、时钟、语音信号模拟输入/输出端、MCU接口（SPI接口）。该芯片采用多级直接模拟存储技术，每次采样值直接存储在片内闪存中，因此可以非常逼真、自然地重现语音。

为了方便用户使用，每次录音的长度和录音时间都会显示给用户。但电池难免会有断电的情况，特别是断电后，语音报警时间也会丢失。为此，本设计加入了EEPROM，断电后存储的报警数据、录音时间等数据不会丢失。经过对存储数据大小和性价比的考虑，选择了AT24C02芯片。该芯片有2k位的存储空间，足以应付本设计的数据量。该芯片接口方便，体积小，在仪器仪表和工业自动化控制中应用广泛，AT24C02是一个不错的选择。

系统通过控制核心单片机来控制各个模块的运行，系统总体设计框图如下：图2-1：

编辑切换到中心

为图片添加标题，不超过 140 个字符（可选）

2.2 主要部件介绍

2.2.1ISD4004

与普通的录音/放音芯片相比，ISD4004语音芯片具有以下优点：首先，录音的段长没有限制，录音不需要A/D转换和压缩。其次，采用快速闪存作为存储介质，在无电源情况下可保存数据长达100年，录音次数在10万次以上。另外，ISD4004还具有录音时间长的优势（最长可达16分钟，本文采用的是8分钟的ISD4004语音芯片）。最后，ISD4004的开发应用具有外围电路简单的优点。基于ISD4004的以上优点，这也是我本文选择这款语音芯片的原因。

ISD4004芯片具有以下特点：

1.单芯片8~16分钟语音录音及播放

2.内置单片机串行通讯接口

3.3V单电源供电

4. 多段信息处理

5.工作电流25-30mA，维持电流1μA

6.无功耗，信息可保存100年（典型值）

7. 高品质、自然的语音还原技术

81,000 次记录循环（典型值）

9.自动静噪功能

10.无需调整芯片内部时钟，可选择外部时钟

电源（VCCA、VCCD）：为尽量减少噪声，芯片的模拟电路和数字电路采用不同的电源总线，分别引到外部封装的不同引脚。模拟和数字电源端最好分开走线，并尽可能靠近电源端连接，去耦电容也尽量靠近器件。

地（VSSA、VSSD）：芯片内部的模拟电路和数字电路也使用不同的地线。

同相模拟输入（ANA IN+）：此为录音信号的同相输入端。输入放大器可用单端或差分驱动。单端输入时，信号经耦合电容输入，最大幅度为32mV峰峰值。此端的耦合电容和3KΩ电阻输入阻抗决定了芯片频带低端截止频率。差分驱动时，信号最大幅度为16mV峰峰值，与ISD33000系列相同。

反相模拟输入（ANA IN-）：差分驱动时，这是录音信号的反相输入。信号通过耦合电容输入，最大幅度为峰峰值 16mV。

音频输出（AUD OUT）：提供音频输出，可驱动5KΩ负载。

片选（SS）：此端为低，即向ISD4004芯片发送指令，两条指令之间的电平为高。

串行输入（MOSI）：此端为串行输入端，主控制器应在ISD输入的串行时钟上升沿前半个周期将数据放入此端。

串行输出（MISO）：ISD 的串行输出端，当未选择ISD 时，此端为高阻状态。

串行时钟（SCLK）：ISD 的时钟输入，由主控制器产生，用于同步 MOSI 和 MISO 之间的数据传输。数据在 SCLK 的上升沿锁存到 ISD，在下降沿移出 ISD。

中断（/INT）：此端子为开漏输出。当 ISD 在任何操作（包括快进）期间检测到 EOM 或 OVF 时，此端子变为低电平并保持低电平。中断状态在下一个 SPI 周期开始时被清除。中断状态也可以使用 RINT 指令读取。OVF 标志—-表示 ISD 的录制和播放操作已到达存储器的末尾。EOM 标志—-仅当播放期间检测到内部 EOM 标志时，此状态位才设置为 1。

行地址时钟（RAC）：开漏输出。每个RAC周期表示ISD存储器已操作一行（ISD4004系列中的存储器共有2400行）。信号保持高电平175ms，低电平25ms。在快进模式下，RAC保持高电平218.75μs，低电平31.25μs。此端子可用于存储管理技术。

外部时钟（XCLK）：此端子内部带有下拉元件。芯片内部的采样时钟在出厂前已经调整好，误差在+1%以内。商用级芯片在整个温度和电压范围内频率变化在+2.25%以内。此时钟已经比较精确，所以一般不使用外部时钟。当外部时钟不接地时，此端子必须接地。

自动静噪（AMCAP）：当录音信号电平低于内部设定的某个阈值时，自动静噪功能会衰减信号，有助于在没有信号（静音）时保持噪音。通常，此端子用1mF电容接地，构成内部信号电平峰值检测电路的一部分。检测到的峰值电平与内部设定的阈值进行比较，以确定自动静噪功能的转折点。信号较大时，自动静噪电路不衰减，静音时衰减6dB。1mF电容还会影响自动静噪电路对信号幅度的响应速度。将此端子连接到VCCA可禁用自动静噪。

ISD4004工作在SPI串行接口上，SPI协议是一种同步串行数据传输协议，协议假定单片机的SPI移位寄存器在SCLK的下降沿进行操作，因此对于ISD4004来说，在时钟的上升沿锁存MOSI引脚的数据，在下降沿将数据发送到MISO引脚。协议具体内容为：

SS 在传输过程中必须保持低电平，在两个指令之间必须保持高电平。

数据在时钟的上升沿移入，在下降沿移出。

4、SS变为低电平，输入命令和地址后ISD才能开始录音、播放操作。

指令格式为（8位控制码）加（16位地址码）。

如果 ISD 的任何操作（包括快进）遇到 EOM 或 OVF，就会产生中断，并且在下一个 SPI 周期开始时清除中断状态。

当使用“读取”指令将中断状态移出 ISD 的 MISO 引脚时，控制和地址数据也应同步从 MOSI 引脚移入。因此，需要注意移入的数据是否与设备当前的操作兼容。当然，也可以在一个 SPI 周期内同时执行读取状态和启动新操作。

所有操作在运行位（RUN）设置为 1 时开始，设置为 0 时结束。

所有的指令都在SS的上升沿执行。

本芯片的上电顺序为：设备需要延时TPUD后才能开始操作，因此用户发出上电命令后，必须等待TPUD之后，才能发出操作命令。

例如，如果你想从00开始发音，你应该遵循以下顺序：

发出 POWERUP 命令；

等待TPUD（开机延时）；

发送地址值为00的SETPLAY命令；

当发出PLAY命令时，设备会从地址00开始播放，当出现EOM时，会立即中断并停止播放。

如果录音从 00 开始，则时间如下：

发出POWERUP命令；

等待TPUD（开机延时）；

发出 POWERUP 命令

等待2次TPUD；

发送地址值为00的SETREC命令；

当发出REC命令时，设备从地址00开始录音，当出现OVF（内存结束）时停止录音。

第三章硬件设计 3.1 系统总体工作原理系统主要由七部分组成，语音模块部分、蜂鸣器部分、控制处理部分、数据存储部分、中断按钮部分、显示部分和实时时钟部分，如图3-1所示：

3.2语音信号输入电路的主要元件是驻极体传声器，电路选型主要有两种方案，如图所示。

解决方案1：如图3-2所示。

解决方案2：如图3-3所示。

图 3-3 Mic 电路连接方法二 3、方案对比：驻极体麦克风转换成电信号后的语音信号非常微弱，如果对其进行放大后再送到语音芯片，可以提高信噪比，达到更好的抑制噪声的效果。方法二中利用三极管对驻极体麦克风产生的信号进行放大就可以达到此效果，所以本设计采用方法二中的电路。 3.3LM386 音频功放电路本设计中，语音芯片输出的语音信号非常微弱，不能直接驱动扬声器，所以在语音芯片和扬声器之间增加了功率放大电路。

功放电路采用美国国家半导体公司生产的音频功率放大器LM386，由少数电容、电阻组成（如图3-4所示）。该放大电路放大效果好，噪声小，满足本设计的要求。其集成放大器电压可达26dB，机内电压放大倍数为20，可调电阻R4可调节扬声器的音量。

3.4 LCD1602电路 1602采用标准的16针接口，其中：引脚1：VSS为电源地引脚2：VCC接5V电源正极引脚3：V0为LCD显示器对比度调节端，接正电源时对比度最弱，接地电源时对比度最高（对比度过高会出现“重影”，可用10K电位器调节对比度）。引脚4：RS为寄存器选择，高电平为1时选择数据寄存器，低电平为0时选择指令寄存器。引脚5：RW为读写信号线，高电平（1）为高电平时进行读操作，低电平（0）为低电平时进行写操作。引脚6：E（或EN）端为使能端。高电平（1）跳变高表示读取信息，负跳变负表示执行指令。引脚7～14：D0～D7为8位双向数据端。引脚15～16：空引脚或者背光电源。引脚15为背光正极，引脚16为背光负极。本设计具体连接方法如下图3-7所示：

实物图：

{{userData.name}}已认证

基于 51 单片机的语音实时采集系统：功能强大，应用广泛

嵌入式技术范畴：Arnduino、arm、树莓派、单片机的区别与定位

数字电路课程设计之交通灯控制器实验报告

归档

分类目录