直播这个其实可以考虑,当然,他自己肯定没有直播的打算,而是用AI虚拟主播直播,毕竟现在的“皮套人直播”的也不少,应该也不会显得太另类。
因为不打算真人直播,所以有一个亟需解决的问题就是和弹幕的互动问题,毕竟,直播的灵魂就是通过弹幕和观众互动。
针对这个问题,肖然的初步设想就是通过程序对弹幕进行抓取并过滤解析,把那些脏话、敏感或其他不适合回复的话过滤,然后利用大语言模型(类似chatgpt)生成回复,然后再把回复的文字通过TTS(文字转语音)模型转换成适合的语音输出。
当然,这个计划短期内实现不太可能,毕竟这个工作量比较大,并且市面上的大语言模型现在也达不到预期的效果,需要他自己单独训练,比如收集一些做的比较好的主播的日常直播内容作为训练数据。
但是从长远考虑倒是一个很不错的项目,如果他的直播效果能够达到近似真人的程度,那么就能够代表他训练的大语言模型最起码在聊天方面是超过了目前的GPT4的,这其实也能作为一个对他后期训练出来的模型的检验标准。
第五个:利用SD(Stable Difussion)文字生成图片模型赚钱,这个模型挺火的,最近很多lsp用它生成那种图片,看效果还是蛮具有诱惑力的。
不得不说,有时候欲望也是促进生产力的一种不错的方式,毕竟,有些人让他熬夜加班可能不行,但是研究怎么生成那种好看的图片估计可以。
这个倒是近期最有可能实现并落地的东西。
分析完之后,肖然决定近期的赚钱计划就是用SD生成图片提供给用户下载了。
SD模型是开源的,开源意味着免费,每个人都可以下载下来进行本地部署,当然,前提是你的电脑配置要支持,普通家庭用的那种集成显卡的电脑就别想了。
估计单单电脑配置方面,就能筛选掉一大批想要玩这个的人了,毕竟,肖然新买的笔记本玩这个都够呛,更不用说部署过程中如果遇到问题,没有程序开发基础的人可能都要脑壳原地爆炸。
对于肖然来说,他手上刚好有1台服务器能满足这个配置,倒是可以用这个先尝试部署一下。
而肖然的主要目标群体就是这些有色心但是玩不了这个的LSP,当然,可能也有其他有别的正常设计需求的人来使用。
这章没有结束,请点击下一页继续阅读!
想到这里,他就另开了一个新的文档,准备把他脑海中的设想的方案详细记录下来。
“呈现方式:网站,可以提供给电脑端,平板和手机端的用户使用。
生成图片风格:二次元。
目标群体: