今天,我研发的自动记账APP,已经突破了千人公测大关,活跃用户数量也首次突破了500,回顾这一个多月的过往,真的感觉一切都是值得的。所以今天我想和大家详细说说这个项目怎么做出来的。
2月份的下旬,春节假期已过,想着反正没啥事做,不如重新尝试能不能把自己预想了很久的项目做一次试试,毕竟AI编程的风已经吹了很久,因为要做鸿蒙的软件,所以我首次去官网,下载了deveco studio这个IDE,然后通过模板建立了第一个项目文件夹。
因为自己没做过产品经理,所以也没有很习惯做很详细的PRD,所以最开始的方案是我编写了大概200字的自然语音产品描述,然后交给了当时号称自动编程的trae来进行初步的实施,但是经过几轮的测试,发现trae的效果可以说是典型的又快又乱,最终的结果就是我连续删除了好几个项目,名字都快被用完了。
经过连续5天56小时的连续尝试,基本确定了,纯靠自然语言,AI的随机性太大,所以还是需要自己先完成UI的构思,所以我打开了KIMI,因为他可以直接预览html效果图,经过大概6轮的调整,我得到了最初理想的UI效果图,于是乎,我带着记账截图和2天内经过多次迭代的产品描述,第7次开启了AI编程的尝试
这段时间里,我汲取了上次的教训,尝试使用trae和studio内置的code genie的双重运行,trae负责主要需求功能的开发,code genies负责修复那些trae一直修不好的BUG;
当然,也有code genies直接摆烂说无法修复的时候,这时候也会反过来让trae去修复,就这样双方经常出现推翻对方代码的情况,一度让我觉得这就是个没有希望的方案。尤其是中间还经历了一次被claude code将整个index删除的崩溃后,我差点放弃了这个项目。
经过复盘和学习,我开始为AI建立规则,例如针对MVP功能的语音识别,AI最初都是瞎写一通,甚至用了安卓的方法,所以我开始访问华为网站寻找语音识别API的资料,并将对应的链接交给了deepseek让他给我生成了corespeechkit的开发SKILL,并要求AI基于SKILL去开发和修改,果然,有了对应的技术输入,AI的code终于有了改善,第一次成功的通过了deveco studio的编译,首次在我的mate70手机上运行打开,虽然那只是一个很简陋,很丑的首页。
有了第一个可运行的版本后,后续的UI修改和功能修复就方便了许多,因为终于可以通过hilog看到了日志,遇到问题还可以将日志导出,交给AI进行阅读和针对修复。而随着studio从5.0升级到6.0,那个傻瓜一样的codegenie也终于多了一些更有针对性的能力,比如arkts UI可以专门写UI相关的代码,比trae会更符合鸿蒙的要求。
随着第一版语音识别和统计功能的在自己手机上测试通过,我终于向华为提交了应用上线审核,但是经过6个小时的等待,迎来的结果是不通过,原因除了图标没有分层处理,没有暗黑模式,授权请求不顺利这些不影响运转的问题外,就是测试人员的手机正常完成超过10000的金额识别,被认定为无法实现基本的功能
被驳回后,我终于意识到,我犯了一个错误,那就是长期起来,我的APP都是在一台已经手动修改过各种权限的手机上运行,所以对于初始安装的问题,就被忽略了,
所以我卸载和清理了软件数据,从新开始安装,终于发现了新装用户在请求权限和弹窗提示之间的矛盾性,也修复了金额过晚的时候语音无法识别的问题。
终于在3月14日完成第一版的成功上架。
夜间模式、桌面服务卡片上线,实现从桌面卡片直接跳转并自动开启语音识别。
闪控球自动识屏记账功能上线,支持微信、支付宝结算页面,以及京东,淘宝、拼多多、抖音商城、快手小店等主流电商平台历史订单页面进行单条识别。
闪控球自动识别订单列表,实现首次对多个订单的识别
带来智控键双触无感记账模式,并开启千人公测,应用不再需要提前开启和常驻后台。
看到应用尝鲜上架的那一刻,我悬着的心终于放下,一个多月,经常一不小心干到晚上12点半,坐得手掌都压出了淤块,但是看到自己的APP,已经能比肩那些收费的商业APP,仿佛一切都已经值得。
预计发布控制中心启动,实现半无感记账模式
预计4月内完成,彻底实现无感记账的全自动流程,多单能自动跳转确认页面(等待华为新API发布)
预计6月内完成,实现控制中心&智控键相同的无感记账模式,覆盖华为主流机型的软硬件模式。