微软开源语音生成模型:vall-e(x)

We extend VALL-E to a cross-lingual neural codec language model, VALL-E X, for cross-lingual speech synthesis, and train a multi-lingual conditional codec language model to predict the acoustic token sequences of the target language speech by using both the source language speech and the target language text as prompts. VALL-E X inherits strong in-context learning capabilities and can be applied for zero-shot cross-lingual text-to-speech synthesis and zero-shot speech-to-speech translation tasks. Experimental results show that it can generate high-quality speech in the target language via just one speech utterance in the source language as a prompt while preserving the unseen speaker’s voice, emotion, and acoustic environment. Moreover, VALL-E X effectively alleviates foreign accent problems, which can be controlled by a language ID.

This page is for research demonstration purposes only.

[……]

阅读更多

Meta llama3 开源大模型部署-测试基于 ollama

Meta llama 的集成环境可以通过这个ollama项目进行安装,在mac和linux上面非常简单,现在windows 版本也是预览版本,可以尝试安装。

https://ollama.com/

下载模型后就可以直接通过命令行进行执行,非常快速。下载模型时可能初始速度比较慢,但后面越下载越快。

选择合适的客户端进行安装。

通过以下程序查看如何启动 meta 的llama3

https://ollama.com/library/llama3

Meta AI官网,可以查看 Meta 的llama 3的介绍。

[……]

阅读更多

Esp32- wroom-32d 每次刷入系统前需要先按下boot键

从自己的设备盒子里里面找到一块Esp32- wroom-32d 板卡,找了一块土壤湿度测试芯片,然后准备通过Ardunio 刷机测试一下,编程完成以后上传系统,一切都很正常,串口也返回信息,但是 Arduino 控制台显示报错。

串口也返回信息,但是 Arduino 控制台显示报错。

[……]

阅读更多

MAX 电脑通过ssh访问远程服务器的网络环境

在服务器运维的时候,经常会出现需要访问服务器所在区域内网的web服务的情况,如果无法连接到服务器的机房内网,可以使用在内网部署一台可以ssh访问的服务器,然后通过putty终端或者是mac中的终端连接到所在网络的ssh服务器上,建立一条端口所在隧道,通过ssh服务器中转访问内网的一些web服务。

mac下使用这个终端命令建议本地与远程服务器的映射端口隧道。 运行后输入本机密码和远端密码,不要关闭终端软件,只要链接没有断开就可以一直使用这个代理隧道。username 换成你的服务器账号,app.sd.cn 换成你的服务器ip或者域名。

sudo ssh -qtfnN -D 127.0.0.1:1087 [email protected] -P

[……]

阅读更多

职业健康系列(二 )IT 行业工作者个人日常注意事项

在职业健康系列的第二部分《个人日常注意事项》中,将重点讨论日常生活中应当关注的健康维护要点,包括但不限于视力保护、皮肤保养、发型和头皮健康维护、预防脱发策略、颈椎和手部健康保护、以及久坐时的保健措施。此外,还会探讨如何保持良好的个人形象和发展有效的对外沟通技巧,以促进职业生涯的成功和个人福祉的提升。

个人日常注意事项:

视力保护、皮肤保护、发型保护、脱发烦恼、颈椎保护、鼠标手键盘手、久坐保护(肩周,坐姿,个人形象)、对外沟通等。

重点关注以下方面:保护视力以防眼睛疲劳,皮肤保养以对抗长时间面对电脑的负面效应,维护健康的发型和头皮状况,预防脱发。同时,注意颈椎和手部健康,避免长时间使用鼠标和键盘引起的伤害。久坐保护措施包括注意肩膀和坐姿,以及保持良好的个人形象。此外,发展有效的对外沟通技巧也非常重要。这些措施有助于提升个人的日常生活质量和工作效率。

[……]

阅读更多

Chagpt API 和注册付费踩坑记录

你看到机会,就是机会,你看到困难,就是困难。

我从头开始注册了一个chatgpt 账号,首先是注册了一个Hotmail邮箱。

又在腾讯云买了一台新加坡的服务器,本来是打算用它部署python 脚本的,结果也是一直报错,最基本的 pip install openai 命令也很难搞定,最后还是用了php开源代码直接读接口。

现在新加坡的服务器用来通过putty 进行代理上网。

通过putty 进行登录服务器的隧道。

[……]

阅读更多

不适合手机阅读的 pdf 通过微信读书导入转为 文字版

最近用微信读书 App 阅读pdf 文档,发现微信阅读居然主动 PDF 转换成文字版,并且做了一些排版,图片扫描出来图书,他居然能转化为文字版本,大部分文字和图片格式段落都做了保留。

在一些老书和图文混排,头位等处理上还有一些兼容问题,但已经不影响阅读了,文字和图片也没有丢失,这种对个人上传内容的优化化处理还是很方便的。

[……]

阅读更多

有哪些比较好的AI图片生成网站

最近想要学习一下使用AI画图来生成一些图片供自己使用,使用AI画图产生的图片可以规避很多图片版权使用的问题,这样可以更多的在文章里使用自己想要体现内容的配图,之前使用的Stable Diffusion 的谷歌记事本版本进行过图片生成尝试,最近图片生成的领域还是挺火爆的,还是要多了解一下,在知乎找到一篇介绍这些内容的文章,内容挺全面的,特意转载保存一下, 以备学习使用。

[……]

阅读更多