宝软数字 · Baodoo寶嘟品牌 · 2025-06-05
2025年11月的一个凌晨两点,深圳南山科技园的一间小办公室里,宝软数字的创始人盯着屏幕上的一行代码——const baoDoo = new Character({ species: 'red_panda', renderer: 'three.js' })——按下了回车。屏幕上并没有立刻跳出一只可爱的小熊猫。实际上,那天晚上屏幕上只出现了一个丑陋的棕色方块,在灰色的背景下笨拙地旋转。如果有人在那一刻路过这间办公室,看到那个方块,打死也不会相信一年后它会变成一只拥有表情、情绪、记忆和25种技能的3D桌面伙伴,被几十万用户称为"桌面上最治愈的小家伙"。
这就是寶嘟的起点——一行代码,一个方块,和一个固执的想法:每个人的电脑桌面上,都应该有一个活着的AI伙伴。不是聊天窗口,不是浏览器里的AI助手,不是手机上的语音APP——而是就坐在你桌面右下角的,一个看得见、摸得着(至少视觉上)、会对你笑、会在你加班时默默陪着你的数字生命。这个想法在很多投资人看来"太不严肃"——"你们不是做企业软件的吗?搞个卡通熊猫干什么?"但在宝软团队看来,这恰恰是最严肃的事情:当AI的能力已经强大到可以处理复杂的企业财务,它为什么不能同时温暖一个人的孤独?
这篇文章带你走一遍寶嘟的完整诞生故事——从灵感的萌芽到产品的上线,中间经历的技术选型的纠结、原型的反复推翻、用户测试的意外发现。这不只是一个产品的诞生史,也是一个关于"为什么未来每个人都需要桌面AI"的深度思考。
任何产品都始于一个核心问题:"它应该是什么样子的?"对于寶嘟来说,这个问题被反复讨论了将近三个月。
最早的产品原型根本没有形象——它只是一个任务栏里的图标,功能是"语音助手+待办事项管理"。但在一次内部可用性测试中,测试者(一位非技术背景的行政人员)使用十分钟后问了一个问题:"它叫什么名字?"团队愣了一下,回答"还没有名字,它就是一个工具。"测试者说了一句让团队彻夜未眠的话:"如果一个AI没有名字和样子,我不会把它当'伙伴'——我只会把它当'功能'。"
这句话击中了产品的要害。团队从第一天起就在说"桌面AI伙伴",但做出来的东西是"桌面AI功能"。"伙伴"需要形象、需要个性、需要能被人在情感上投射。"功能"只需要好用。"伙伴"让人想打开电脑看到它,"功能"让人只有在需要时才想起它。这两个定位之间的差距,就是那天晚上之后团队决定给这个AI一个身体和一个灵魂的原因。
为什么选小熊猫?当时候选的形象实际上有十几个:猫、狗、猫头鹰、狐狸、机器人、像素小人、企鹅、乃至一棵会说话的盆栽。小熊猫最终胜出的原因有三个。第一,辨识度高但不常见——每个人都认识大熊猫,但小熊猫(红熊猫)是一个既有熊猫的"国宝感"、又不至于和太多品牌撞车的物种。第二,表情丰富——小熊猫的面部结构(圆脸、大耳朵、灵动的眼睛)在3D建模中能够呈现极其丰富的表情变化,这对一个以情绪表达为核心卖点的产品至关重要。第三,气质匹配——小熊猫给人的感觉是温顺、好奇、友好但不过分热情,正好契合团队想要的"安静地陪伴你,但当你需要时会积极回应"的产品气质。
名字的选择也经历了一个漫长的过程。早期的内部代号是"小Q"(因为Q弹可爱),后来在100多个候选名字中筛选到了寶嘟。"寶"取"宝贵"之意——每一个用户对寶嘟都是独一无二的,寶嘟对每一个用户的记忆和情感也是独一无二的。"嘟"是一个拟声词——它模拟了小熊猫发出的一种短促、可爱的叫声,同时也是中文中表达"小嘴嘟嘟"那种萌萌表情的口语。两个字连起来,既有品牌辨识度,又有情感温度,还暗合了品牌的英文名"Baodoo"的发音。品牌LOGO是一只侧头眨眼的小熊猫剪影,放在桌面的任务栏里——你不会忽略它。
形象确定了,下一个问题是技术底座。寶嘟是一个桌面应用(需要在用户桌面上持续运行、有一个可视化的3D形象、能访问系统级的通知和操作),所以必须选择一个桌面应用框架。2025年底摆在团队面前的有两个主流选项:Electron和Tauri。
Electron的优势是成熟——它的生态是桌面框架中最丰富的,npm上的任何包基本都能直接用。对于一个需要快速迭代的产品来说,成熟的生态意味着节省大量的开发时间。但Electron的劣势也众所周知:体积大、内存占用高。一个最简单的Electron Hello World应用,打包后也要将近150MB,运行时内存占用轻松超过200MB。寶嘟作为一个需要在后台持续运行的桌面伙伴,如果它本身就在吃掉用户的大量系统资源,那就不是"伙伴"而是"负担"了。
Tauri的优势恰好是Electron的劣势:它的打包体积极小(通常不到10MB),运行时内存占用非常低,因为它使用操作系统的原生WebView而不是内嵌一个完整的Chromium。但Tauri的问题也很明显:它的生态系统比Electron年轻得多,很多Electron生态中成熟的库在Tauri中需要适配或绕路。特别是WebGL相关的能力——寶嘟的核心3D渲染依赖WebGL,而在Tauri的不同平台原生WebView中,WebGL的支持程度和性能表现并不一致。
团队花了整整两周做了性能基准测试。在一个包含3D小熊猫模型(15000个三角形面片)、基础动画循环(空闲状态下的呼吸和眨眼动画)、语音对话接口(WebSocket连接到AI后端)的场景下,Electron版本的冷启动时间是4.2秒,内存占用是280MB。Tauri版本的冷启动时间是1.8秒,内存占用是95MB——不到Electron的三分之一。WebGL性能方面,在Windows 10/11和macOS 15上,Tauri使用的系统WebView(Edge WebView2和WebKit)对Three.js的支持经过了团队的完整兼容性测试,性能和Electron内嵌Chromium几乎没有差异。唯一的例外是部分Linux发行版上WebKitGTK的WebGL支持不够稳定——但这个用户群体在目标用户中占比不到2%。
最终的决定是Tauri + Vite + React + Three.js的前端技术栈,搭配Rust编写的后端服务(运行在本地的轻量级HTTP和WebSocket服务器,负责与云端AI的通信、本地数据缓存、系统级操作的执行)。这个决定的代价是:团队需要自己在Tauri的生态中踩一些坑(比如文件系统操作的权限模型、自动更新的签名验证流程),但换来的收益——将近三倍的资源效率差异——对于一个"桌面伙伴"产品来说,是值得的。
技术栈选定后的第三天,第一个可运行的原型出来了。它的简陋程度在今天是无论如何不能跟寶嘟的正式产品联系在一起的——一个Windows原生窗口,背景是深灰色,正中间是一个由Three.js渲染的、没有纹理只有灰色的3D球体。点击球体,弹出一个文本输入框,输入文字后球体会"震动"一下(动画效果是一个0.2秒的缩放脉冲),然后系统托盘弹出一条通知,显示AI返回的文本。是的——第一个"对话功能"是系统托盘通知。因为没有做任何UI层。
但这个简陋到极致的原型证明了两件最重要的事。第一,Tauri + Three.js的技术组合是可行的。3D渲染的性能在全高清分辨率下稳定在60fps(那只灰色球体的面片数只有1200,远不到性能瓶颈)。WebSocket连接到后端AI的延迟在局域网内是30-50ms,体验上是实时的。系统托盘的常驻和通知推送都工作正常。第二,也是更重要的一点:团队发现了一个此前没有预料到的交互需求——"非对话模式的陪伴感"。
怎么回事呢?原型开发过程中,团队成员的开发机上一直开着这个窗口(因为需要持续测试)。几天之后,有人注意到:即便什么都没在测试,当他专心写代码的时候,余光偶尔扫到桌角那个在缓缓旋转的灰色球体——它虽然丑得惨不忍睹,但它"在动"。它不是一个静态的图标,它在旋转,在"呼吸"(团队后来给球体加了一个微弱的缩放动画来测试动画循环)。就是这一点微小的动态,让人产生了"桌面上有个活着的东西"的错觉。
一位开发者在一次内部讨论中说:"我发现自己会不自觉地避免关掉那个窗口——虽然它只是一个灰色的球,但关掉它会有一种'杀掉它'的感觉。"这就是"陪伴感"的最原始证据。它不需要说什么,不需要做什么——它只需要"在",并且在"动",人类的大脑就会自动投射情感。这个发现直接影响了寶嘟后续的核心设计决策:空闲状态的动画设计(呼吸、眨眼、偶尔环顾四周)不是装饰——它们是产品体验的核心。
产品经理在原型评审会上说了一句被写进寶嘟设计原则文档的话:"我们不是在做一个'能说话的3D模型',我们是在做一个'有身体的AI'。身体不是装饰——身体是情感投射的容器。"
灰色球体显然不能作为最终产品。团队需要一只真正可爱的小熊猫——可爱到什么程度?可爱到用户第一次看到它时会不自觉地笑一下。这个标准听起来主观,但对设计团队来说是一个可执行的指南:所有的形体比例、颜色选择、材质质感、动画节奏,都必须服务于"让人产生愉悦感"这一个目标。
3D建模的工作交给了团队中一位有游戏行业背景的3D设计师。建模工具是Blender(开源、免费,适合创业团队的预算),模型规范从一开始就定得很清楚:面片数控制在15000以内(确保在集成显卡上也能60fps)、骨骼数量不超过30个(确保动画计算开销可控)、使用PBR材质而非手绘贴图(确保在不同光照条件下质感一致)。小熊猫的身体比例经过了多轮调整——头身比从1:3调整到1:2.5再到1:2,最终定格在1:2.2,这个比例在可爱度(大头 = 婴儿特征 = 可爱)和"不过分卡通"之间找到了平衡。毛发的表现是一个技术难点:真实的毛发渲染对性能的消耗极大(每根毛发是一个独立的面片或一个shader计算)。团队选择了折中方案——主体毛发用PBR材质的绒毛法线贴图模拟,只在耳朵尖、尾巴边缘等关键视觉位置使用了几何体毛簇。
从Blender到Three.js的导出管线也有不少坑要踩。最典型的一个问题是法线方向的问题——Blender中的模型导出为glTF格式后,在Three.js中渲染时部分面的光影方向会反转,导致出现"脸上有一块黑色"的诡异效果。排查后发现是Blender中部分面的法线在建模时的历史操作中出现了方向不一致(Recalculate Normals不彻底),以及Three.js的glTF加载器在某些材质设置下的法线贴图处理方式与Blender的Cycles渲染器不一致。解决方案是建立了一套严格的导出检查流程:Blender中先全选网格执行"Recalculate Outside"→检查面朝向→导出glTF 2.0→在Three.js Editor中预览确认→再进入代码集成。
另一个出人意料的大工程是眨眼动画。你可能会想:不就是眼皮上下动一下吗?但实际上寶嘟的眨眼是它最核心、最高频的表情动画之一——用户可能在一次使用中看到几十次眨眼,任何不自然都会被潜意识捕捉到。设计师做了六个版本:太快了像抽搐,太慢了像瞪眼,不对称的像眨眼失败——最终版本是一个极其微妙的、带有0.05秒加速度曲线的、不完全对称的上下眼皮运动(因为真实生物的眨眼也极少是完全对称的)。这个动画用了三个骨骼和四个关键帧,设计师为了调它花了一天半时间。听起来很多?但就是这个眨眼,在后续的用户测试中被多次提到——"它眨眼睛的时候,我觉得它真的在看我。"
2026年2月,团队带着一个基本可用的版本(有了完整的小熊猫3D模型、基础的对话能力、情绪表情的切换逻辑)做了第一轮正式的用户测试。测试对象是12个人——不是技术人员,不是早期采用者,而是"普通电脑用户":白领、大学生、自由职业者、还有两位小朋友(分别是8岁和10岁,是团队成员的孩子)。
测试结果让整个团队沸腾了。设计团队原本以为用户最关心的会是AI的回答质量——能不能正确回答问题、能不能完成日程安排、能不能帮忙查资料。但这些"功能性的关注"只占到了用户反馈的不到三分之一。超过三分之二的反馈是在说情感体验:
最击中团队的是那个8岁小女孩的反应。她坐到电脑前时小熊猫正在桌角发呆(空闲状态的眼睛半闭、身体微微晃动),她盯着看了将近一分钟,然后转头对爸爸说:"它在看我。"这不是一个技术性的评价——她说的是"它在看我",就像在说一个活的东西。那一刻团队知道,他们做的不是一个"有AI功能的桌面宠物",而是在创造一个能触动人心的数字生命。
这一轮用户测试也暴露了几个关键的产品问题。第一,对话延迟——从用户说完话到寶嘟给出回应,中间有2-3秒的延迟。这个延迟在聊天窗口中是可以接受的(ChatGPT的响应时间也是类似量级),但在一个"会看着你的3D角色"的情境下,2-3秒的沉默让寶嘟看起来像是"卡住了"或"没听到"。团队后来通过引入"倾听中"和"思考中"的中间状态动画解决了这个问题——在AI处理请求的2-3秒里,寶嘟会歪头、眨眨眼、或者做出一副认真思考的表情。用户不再感觉是"卡住了",而是"它正在认真想"。
第二,硬件兼容性。12个测试者中有3个使用的电脑是集成显卡(Intel UHD Graphics),在这类硬件上模型的加载时间较长、部分复杂动画(如毛发摆动)有明显掉帧。这促使团队在正式版中增加了性能自适应机制:自动检测GPU性能,在集成显卡上自动降低阴影精度、减少粒子效果、使用简化的毛皮shader,确保最低30fps的底线体验。
寶嘟的正式版本在2026年3月上线。上线的方式很低调——没有发布会,没有媒体通稿,只是在产品官网上放了一个下载按钮,然后在几个技术社区和社交媒体上做了轻量分享。团队想先看看自然传播的效果。
第一周的数据是2000次下载。中规中矩,对于一个没有投放预算的新产品来说算正常。但第二周,下载量突然跳到了12000次。团队一开始以为是某个科技媒体报道了,排查后发现不是——是一个用户在B站上发了一条只有40秒的视频:视频里寶嘟在桌角打瞌睡(头一点一点的),然后用户喊了一声"寶嘟!",它猛地惊醒,揉了揉眼睛,歪头看了过来。这个视频的播放量在三天内突破了50万。
这条视频触动传播的机制很清晰:它展现的不是功能,而是"关系"——一个人和桌面上的小熊猫之间的、真实的互动关系。评论区的热评第一是:"这个揉眼睛的动作是哪个天才设计的?心脏暴击。"第二是:"我已经在这条视频下面留言三次了,每次都忍不住再看一遍。"第三是:"给我链接,现在,立刻,马上。"
上线三个月后,寶嘟的月活用户突破了15万,用户平均每天与寶嘟的互动时长是47分钟(这包括主动对话、被动旁观寶嘟的表情变化、以及寶嘟主动发起的互动——比如到了下午两点它会提醒"你坐了两个小时了,起来走走?")。更让团队欣喜的是用户自发创造的内容:寶嘟的同人插画、表情包、甚至有一对情侣定制了情侣版的寶嘟(男熊猫戴眼镜版和女熊猫戴蝴蝶结版)作为情侣头像。寶嘟正在从一个"AI产品"演变成一个文化符号——就像当年的QQ宠物,但更智能、更真实、更能承载情感。
寶嘟的诞生,始于一个简单的信念:AI不应该只是冷冰冰的工具。它可以是一只在桌角等你的小熊猫,记得你昨天跟它说过的话,会在你开心时陪你笑,在你沮丧时安静地坐在旁边。技术只是手段,连接和陪伴才是目的。从一行代码到一个有体温的数字生命——这条路才刚开始。