微软开源语音生成模型:vall-e(x)

We extend VALL-E to a cross-lingual neural codec language model, VALL-E X, for cross-lingual speech synthesis, and train a multi-lingual conditional codec language model to predict the acoustic token sequences of the target language speech by using both the source language speech and the target language text as prompts. VALL-E X inherits strong in-context learning capabilities and can be applied for zero-shot cross-lingual text-to-speech synthesis and zero-shot speech-to-speech translation tasks. Experimental results show that it can generate high-quality speech in the target language via just one speech utterance in the source language as a prompt while preserving the unseen speaker’s voice, emotion, and acoustic environment. Moreover, VALL-E X effectively alleviates foreign accent problems, which can be controlled by a language ID.

This page is for research demonstration purposes only.

[……]

阅读更多

Meta llama3 开源大模型部署-测试基于 ollama

Meta llama 的集成环境可以通过这个ollama项目进行安装,在mac和linux上面非常简单,现在windows 版本也是预览版本,可以尝试安装。

https://ollama.com/

下载模型后就可以直接通过命令行进行执行,非常快速。下载模型时可能初始速度比较慢,但后面越下载越快。

选择合适的客户端进行安装。

通过以下程序查看如何启动 meta 的llama3

https://ollama.com/library/llama3

Meta AI官网,可以查看 Meta 的llama 3的介绍。

[……]

阅读更多

Esp32- wroom-32d 每次刷入系统前需要先按下boot键

从自己的设备盒子里里面找到一块Esp32- wroom-32d 板卡,找了一块土壤湿度测试芯片,然后准备通过Ardunio 刷机测试一下,编程完成以后上传系统,一切都很正常,串口也返回信息,但是 Arduino 控制台显示报错。

串口也返回信息,但是 Arduino 控制台显示报错。

[……]

阅读更多

MAX 电脑通过ssh访问远程服务器的网络环境

在服务器运维的时候,经常会出现需要访问服务器所在区域内网的web服务的情况,如果无法连接到服务器的机房内网,可以使用在内网部署一台可以ssh访问的服务器,然后通过putty终端或者是mac中的终端连接到所在网络的ssh服务器上,建立一条端口所在隧道,通过ssh服务器中转访问内网的一些web服务。

mac下使用这个终端命令建议本地与远程服务器的映射端口隧道。 运行后输入本机密码和远端密码,不要关闭终端软件,只要链接没有断开就可以一直使用这个代理隧道。username 换成你的服务器账号,app.sd.cn 换成你的服务器ip或者域名。

sudo ssh -qtfnN -D 127.0.0.1:1087 [email protected] -P

[……]

阅读更多