Tuneee心声
音乐创作也有AI智能体了!集音乐制作与视频创作于一体的Tunee智能体深度测评
August 24, 2025

本文为转载并翻译自 Koya Matsuo 在 Techno-Edge 上发布的原始博客文章。原始内容的所有权与署名权均归原作者所有。本译文仅供参考与非商业用途。
作者: 松尾公也
所属: TechnoEdge编辑部 高级编辑 / 社区策略师 @mazzo
前段时间就有Beta测试者发布了AI音乐生成服务"Tunee"的使用感受,我收到邀请后立即试用了一下。
Tunee应该读作Tune-e。与Suno和Udio那种通过输入歌词和音乐风格来设置参数进行作曲的方式不同,它采用对话形式来创作音乐,这一点与Producer.ai(原Riffusion)相似。

Tunee的特点
Tunee自己列出了以下特点:
• 智能对话式创作
只需传达想法。无需复杂的参数或专业术语。
• 多媒体理解
上传视频、图片、音频片段,Tunee就能理解情感和风格,生成完美匹配的音乐。
• 实时网络搜索
搜索和分析最新的音乐趋势,始终实现符合时代的声音。
• 专业级成果
智能母带处理、歌词创作、商业许可证等完整的制作流程。
让我们通过实际试用来验证这些功能是否真实,以及达到了什么水平。
首先,作为Beta测试者,我可以使用所有功能,但会员计划预计提供4种方案。与Suno和Udio等类似,付费计划(月费18美元起)可以商业使用。

多模态且集成网络搜索
我目前主要使用的AI作曲服务是Suno。近期宣布将集成DAW功能,能够输出非常高功能和高质量的成果,但为此考虑提示词和歌词时,现状是经常需要借助ChatGPT、Gemini、Claude等大规模语言模型(LLM)的帮助。
如果脑海中没有明确的歌词创意或音乐风格目标,就很难输出这些内容。当然,可以通过上传哼唱或简单弹奏的片段来扩展音乐创意,如果是应用版本,还能从照片创作曲子片段,但无论如何,如果没有完成音乐所需的知识和表达词汇,就无法传达给服务。
Producer(.ai)不仅可以上传音频作为参考素材,还能上传图片和视频。此外,它还具有网络搜索功能,因此可以在不离开服务的情况下参考当前的音乐趋势、过去的音乐资产、理论和知识。
实际使用体验
那我们来试试看。
当我最初指示"想要创作一种扭曲的流行摇滚,重现披头士后期或西德·巴雷特在位时期的平克·弗洛伊德早期的迷幻声音"时,
它给出了3个选项。
我选择了披头士风格,它展示了个性化计划。分为创建音乐提示词、歌词和乐曲的3个步骤。
很快,就完成了两首只能说是深受披头士后期影响的乐队声音的作品。这样就可以了吧。

从这里可以下载MP3、WAV(44.1kHz、16bit)。还支持STEM生成和下载。STEM目前只有基本的4种:人声、鼓、贝斯和其他。
母带处理功能
声音方面就到此结束了吗……并不是。它有母带处理功能,可以使用3个预设或上传的音源作为参考进行最终的母带处理。例如,参考名为In the Night的J-POP曲目,会提高高频的亮度,扩展声场。


音乐视频生成功能
此外,还可以制作音乐视频。虽然无法制作完整长度的歌曲,但可以在15秒到60秒的范围内,用5种视觉风格生成MV。可以从Vaporwave Anime、Studio Ghibli Pastoral、Glitch Scene、Makoto Shinkai Cinematic、Dreamcore Surrea中选择,但会消耗840个积分。
我选择了吉卜力风格(这个命名没问题吗?)并开始,它会创建由12个场景组成的故事板,生成拍摄提示词。基于此制作分镜,然后制作视频。
视频主题
充满奇思妙想的梦幻之旅,穿越融合现实与幻想的神奇乡村。
视频场景
手绘吉卜力风格的欧洲乡村风景,充满魔法自然和超现实视觉效果。
每个镜头的摄影技法
镜头1 (0.00-5.75):缓慢横摇拍摄小屋内部,柔焦效果,阳光轻柔洒入,镜头轻推向神奇生物。
镜头2 (5.75-9.90):户外广角低角度拍摄,钟楼融化时微妙倾斜,推镜聚焦惊奇反应的野生动物。
镜头3 (9.90-15.32):跟拍主角穿越迷雾森林的跟踪镜头,梦幻镜头模糊,轻柔手持式摇摆。
镜头4 (15.32-19.55):旋转镜头在漂浮镜子间移动,倒影呈现无缝转场,动物特写。
镜头5 (19.55-23.46):蝴蝶上升时的动态向上跟踪镜头,闪烁效果,轻微慢动作强调魔法感。
镜头6 (23.46-27.36):沿林间小径漂移的中景镜头,旋转镜头暗示时钟倒转,柔和光晕。
镜头7 (27.36-31.36):飞马广角镜头,镜头轻柔上升跟随它们进入云层,梦幻晕影效果。
镜头8 (31.36-36.78):围绕旋转主角的螺旋式航拍,迷幻色彩转换,万花筒扭曲效果。
镜头9 (36.78-42.21):滑过拼布乡村的平滑推拉镜头,漂浮镜头模拟漂移感,聚焦超大花朵/鸟类。
镜头10 (42.21-49.47):快速横摇转场,抽象运动,夸张变焦,色彩和形状快速旋转。
镜头11 (49.47-54.01):主角进入发光传送门时的稳定拉远镜头,场景轻柔变换,柔和黄金时刻光线。
镜头12 (54.01-60.00):史诗般广角镜头,缓慢拉远展现整个和谐魔法世界,镜头光晕和发光边缘突出和谐感。
选择是否接受这个分镜,或返回故事板。如果觉得可以,就进入视频生成。
到这里还算顺利,但出现了两次"Sorry, system response failed."警告。第三次尝试。

这种交互就像用Vibe编码编程时一样。对话可以用英语或日语,真的可以很自然地交流。第三次终于成功了。这是前1分钟制作成的音乐视频。

但最后一个场景的左边混入了类似吉卜力著名生物的东西。如果中途发现,这也是可以修改的。
除了吉卜力风格、新海诚风格外还能选择其他风格,所以这种事故也是可以避免的。
话说回来,原本以为只是附加功能的音乐视频生成竟然如此专业,我觉得仅仅用来生成故事板也是个不错的选择。
总评
关于这个Tunee,即使在提示词中输入"披头士""平克·弗洛伊德"等关键词也不会被拒绝,可以继续进行。毕竟只是获得灵感,在这方面设限反而奇怪,真是太好了。
生成的曲子完成度很高,与预期的音乐相符,满意度非常高。从这里探索编曲或调整各个部分,Suno(及其后续的DAW集成)会更方便,所以我会继续使用,但在今后的音乐制作中,我会最大限度地活用这个Tunee。
• 音乐进入了通过AI语音对话创作的时代。Riffusion改名为Producer.ai的AI制作人,只需用日语对话就能为你创作歌曲(CloseBox)2025.08.1
• 音乐人不用就太可惜的AI新功能登场。Suno的AI作曲新模型v4.5+让从人声或器乐进行编曲尝试变得超简单(CloseBox)2025.07.18

• AI作曲服务Suno收购云端DAW WavTool。或将支持MIDI生成和VST?(CloseBox)2025.06.27

• Suno已经不需要DAW了?STEM最多12个部分,主唱和和声也能分离。BPM也能更改(CloseBox)2025.06.4
• 可以用日语提示词高音质生成的AI作曲服务"Riffusion"超越了Suno吗?有4部分的STEM,目前免费无限制(CloseBox)2025.02.1
• 用ChatGPT新AI模型"o3-mini",为没有视频输出的Riffusion和YuE的AI乐曲开发了简单酷炫的可视化工具(CloseBox)2025.02.3
• Suno的AI编辑功能不需要DAW了?识别A段、副歌等结构,部分替换、淡出也超简单(CloseBox)2025.02.19
探索TUNEE的使用场景
Turn Your Mood Into a Song
Share your mood, and Tunee creates a catchy song with melody and lyrics.
Imitation Music Creation
Tunee generates a song in the same style as the provided reference, with vocals, maintaining the original style.
Reimagine Your Song
Keep the essence of your original song—Tunee reshapes your song into a fresh new version.
Electro-R&B Pop
Tunee creates a pop song blending electronic and R&B styles, with vocals in English and Japanese.


