面试官的题目
Q1
近两年的AI发展快速,语音是AI领域的一个方向,相关落地的硬件和软件在市面上已有出现。 前者有“天猫精灵”之类的独立硬件,后者有依托在手机端/无线耳机/可穿戴设备等的语音助手,如小爱同学,Siri,尤其是无线耳机的用户使用增势是十倍速。 现在给你们15mins,构思出一个语音AI使用场景+语音交互方案。 要求是有最多人使用(日活量足够大),留出5mins来汇报你们的产品名称和你们的用户群,使用场景和功能,3mins来给你们补充。
Q2
基于上一道题,在20mins内把你们给的方案进一步细化功能和整体交互,产品规格。 例如“小度,小度,今天天气如何”,细化语音功能内容,给出对话逻辑。 讨论最终产出物。留出5mins来汇报,3mins来给你们补充。
问题
整个讨论的问题
- 会议的人员角色没有分配(leader,计时,汇总)
-
- 思维发散地太广,所有人都在阐述和补充,没有人有汇总在一起,缺乏一个leader 来取舍意见
-
- 没有人来引领好整个逻辑思考和交流流程,忽视面试官的得分点,没有从挖掘需求出发,直接从用户群体入手
- 过度关系某个功能的逻辑,忽视了整体把握
- 口头之争,过度强调解决方案的形式,限制大家思路
- 第一题的核心功能需求,到第二题的时候就被次级功能需求替换
我的不足
- 想法没有表述好,需要学习最快时间建立自己的专业性(口述表达能力)
- 抓到了要点和逻辑,没法准确地表述出来让所有人听,更多地练习短时间内抓准问题要点后传达给所有人听懂,信服(口述表达能力)
- 讨论时候只对着一个人,没有面向所有人,有种互怼的感觉(口述表达能力)
- 没有认真整合好框架和细节,第二次问题汇报的时候,失去了一次表现机会(逻辑记录)
- 被留下沟通的时候,没能在最短时间内推荐一款自己手机中的产品给面试官,勾起面试官的兴趣,私底下练习(口述表达能力)+(学习一下销售技巧)+ (产品思维太弱)
- 没有很好地介绍好自己的所做的项目模块的布局和思考(口述表达能力)+(对自己的模块的认知程度不足)
- 上午的面试官十分钟内草草地结束面试,心情不好,导致下午,虽然提早去面试场地,却没有好好地准备和调整自己状态,有点自暴自弃,面试不作为(学会调整自己的情绪状态)
今晚思路汇总整合
关于第一个问题
有人结合语音性质,提出盲人的辅助情景,我拓宽为所有交流表述不便的人群。 题目要求是日活量大,日活量大分两种,一种独立用户基数大,群体体量大而堆积出来的,类似微博国民级应用,大家哪怕每天只打开看一两次,独立用户日活跃度也会非常高, 一种是高频刚需,即在日常生活中需要频繁多次,由于一天之内多次使用,像外卖,用户的活跃度也会很高。 交流不便的人,像盲人,聋哑人等,对于他们而言,作为人,交流是基本的生存权利,对于缺乏的东西,越会想去珍稀。
因为最近浏览到一个帖子,介绍国外一款软件,叫做”Be My Eyes” ,服务于全世界的所有视力不好的用户群体解决需要视力辨别的情景难题。 用户分为”志愿者”和”视力不好的用户”,志愿者注册时,选择自己的母语语言。 当视力不好的用户遇到问题,如“超市货架上拿到的商品是否过期?地址电话是多少?“的时候,会通过软件通过视频聊天的方式和志愿者取得联系,志愿者帮助他们看,说出答案。
然后大家对着盲人群体之类的这一块用户是否符合“标准的最多数人”开始讨论,开始纠结解决方案的实现。 我提出需要从需求入手,找到一个刚需,如“点外卖”,寻找语音功能结合的可能性,所有后续我们开始讨论有关“语音点外卖”的想法(算了,当时接下去的讨论太乱了,记不住,不回忆了)
当时我关于语音交互的思考
从接受程度高的群体入手,减少用户培训成本
- 用户对语音交互的信任度,年龄大的人对技术的恐惧和抗拒,年轻人更能接受新技术
- 当前的语音交互基础是标准的普通话口头输入,中国庞大的地域差异,带有口音大的群体很难通过来完成语音交互
- 语音助手依托稳定的网络(把输入的语音数据传达到云计算设备连接进行语音,语素的分析),和做充中间媒介的的实体的硬件,缺其一都无法进行语音交互
我的复盘(基于上面的外卖)V1.0
时间: 2019/07/09 01:23
挑选点外卖这个刚性需求,,高频的需求意味着很高的日活量因为人有着一日三餐,排除早餐之外的三餐“午餐,晚餐,宵夜”的习惯。 加之当代人工作繁忙,压力过大,更是懒得亲自做饭和堂吃,区分主食和小吃的不同,还能拓展更多的需求场景。 用户会通过外卖的方式来帮助解决吃饭问题,城市上班族至少一天一次使用频率。 经过多年,越来越多的用户都有过在软件来点外卖的经历,用户点外卖的习惯被外卖服务软件培养地更加频繁。 外卖软件积累的大量的用户操作数据, 通过外卖下单的操作流程(浏览餐厅,选择菜品,填写备注,选择地址,结算下单,确认支付,(接单,送达)信息反馈,餐后评分)可以说被多数人熟知和确定,操作流程的稳定可以为手机上的语音助手方式来点外卖提供可能, 让用户减少手部的交互操作,更快地通过语音助手选外卖,一步到位简化传统点外卖的流程,优化用户体验。
用户画像
一级的用户群体画像: 有着多年的教育学习经验,专科以上学历,是生活在城市,每天去公司上班的上班族,二十到四十之内的年龄,公司离家远,上午到公司上班后,中午留在公司内, 懒得走到附近的店铺堂吃,有经常在相关的外卖软件下单点外卖习惯,忙于工作和业务,缺少午休的时间的中青年人群体。
使用场景
一级使用场景: 到了饭点后,用户唤醒语音助手后,明确表达中午的外卖具体要吃哪家餐厅的具体菜品,语音助手下单,确定了支付流程后,开始等外卖。
二级使用场景: 公司午餐休息时间到,上班族放下手头的工作,看了看所剩不多的午休时间,饿着肚子, 想了想上次吃过的很喜欢一家外卖的菜品,想了想价格低一下的菜品,又考虑到了送达快的商家,一时纠结不出吃什么好, 打开手机软件,唤醒语音助手, 语音助手询问其是否饿的厉害(优先选择位置近,配送速度快),在不在意外卖价格(按照过往记录的外卖价格进行匹配)两个条件后, 语音助手帮助其确定外卖的筛选条件,比较不同的信息后,提供了推荐的商家和菜品,上班族确定了自己心仪的菜品,通知语音助手下单,确认支付后,开始等外卖。
功能
核心功能: 通过语音反馈,帮助用户完成外卖的下单流程(浏览餐厅,选择菜品,填写备注,选择地址,结算下单,确认支付,(接单,送达)信息反馈,餐后评分)
亮点功能: 获取店家信息(菜品信息,价格信息,位置,评分),为用户基于历史行为操作数据,比较不同的店家信息和菜品信息做出推荐。
取名: 管家阿福
有管家的仆人的含义,表达产品的定位
交互流程
语音交互流程是
graph LR
A(语音输入)-->B(语音反馈)
B-->A
语音交互的细节
原则
语音内容注意人性化,语音交互不同视觉交互和操作交互,由于受限产品需要分析用户语音转化内容,交互时间相较之下更长,语音交互需要保持接受信息马上反馈的状态,需要缓解用户的焦急,稳定用户体验的环节,尤其是报错,和反馈,不要让用户等,不要让用户想。
语音内容不宜过长,让用户没有记住了所有内容,听语音的时间过长,引发用户焦急,用户体验下降。
表现智能,等待用户决定时候,需要更加智能,结合当下情景的信息,当用户停顿时候,分析用户的活动规律,天气,气候,周边位置,最近的点过的外卖数据,店家的活动,周边人都在点什么的数据信息,为用户做推荐,提升用户体验
细节
语音的输入需要:”特定的唤醒点“,一句特定的话:“阿福阿福点外卖”
称呼上,产品首次唤醒反馈回答时,在句子前加”主子“来称呼用户
错误反馈时,语音反馈:“小的没听明白,请主子再说一次”
正确反馈时,语音反馈:“小的明白,进入下一步(XX环节)”
为用户做推荐,语音反馈:“小的觉得XX原因,不如试一试XX店家XX菜品”
应用出现问题时,及时反馈,语气诚恳:”主子!阿福出问题,后接问题的原因”
外卖下单的信息元素:
- 周边提供服务的商家名称
- 周边提供服务的商家的相距的距离
- 这家商家提供的菜名名称
- 这家商家提供的菜名评分信息和购买次数
- 结算的总价格
- 备注信息
- 送达的地址位置
- 预计送达时间
- 餐后的评分
语音助手外卖下单泳道图(待定)
语音助手外卖下单时序图(待定)
用户反馈信息过多,店家区分,菜单区分的筛选情况过多,逻辑流程有点卡壳,先暂停绘制,继续优化泳道图
思考问题
转换逻辑
语音交互和视觉操作交互,差异过大,菜品确定时候,商家的筛选的情况很多,各种情况分支,越想越多,需要暂停,等过几天空闲在继续完善。实时反馈过多,对话流程过多,违背了产品是为了更便捷的目的,需要再构思流程。
语音交互的知识点
需要额外吸收一些经验,去多看几本书再补充。
外卖的业务流程
如何把操作交互转化为语音交互上,专业的业务流程需要看文章,和使用软件来了解一下
时间:2019/07/09 16:35