关于谷歌的双面录音再次喋喋不休

让我先重申一下我的怀疑围绕Google的Duplex唱片并不怀疑Duplex本身的想法如果我不得不打赌谁将成为第一个创建人类AI语音系统的人,即使在预订保留等明确定义的任务的有限约束下,也会是Google如果拉斯维加斯有一个投注线,亚马逊也可能有不错的赔率,但谷歌肯定会是最喜欢的。

我们都可以亲自了解Google智能助理今天的效果我并没有声称这些录音是完整的制作,或者说赌博比其他任何人都更加努力。

但谷歌宣布这一切的方式一切都是 -好奇的电话细节released so far, the fact that no one in the media has been allowed to see an actual call happen live — makes me suspect that for one or more reasons, the当前Duplex的状态低于Sundar Pichai在舞台上的暗示。在第一次录音之前他的话被播放了:“您将听到的是Google智能助理实际上正在呼叫一家真正的沙龙为您安排预约让我们听听。“在第二次录音之后:”再一次,这是一个真正的电话。“

你可以准确地解析这些词,并争辩说Pichai从来没有说过他们没有脚本或没有教练,或者录音是未经编辑的但这就像说比尔克林顿在他的“我与那个女人没有性关系”的声明中在技术上是真实的克林顿声明的含义是他没有与他的实习生发生性关系,这不是真的Pichai声明的含义是,现在,谷歌在其实验室中有一个版本的Duplex可以称为真正的餐厅或美发沙龙并预订和听起来真正的人类同时这样做今天不久看看公告中的新闻报道 -混搭守护者边缘晚间标准- 关于Duplex公告的所有报道都是用现在时的形式写成的,就好像Google现在所说的那样,没有或只有很少的编辑。

如果从现在起几个月或更长时间,谷歌可以展示一个真正的双工电话,直播,这不会让我怀疑他们现在无法在2018年5月做到这一点 - 尽管Sundar Pichai上周明确表示他们可以If I’m wrong — if stories come out in the next week or two from journalists granted behind-the-scenes access to listen to Duplex make live calls (and watch them be parsed correctly, creating calendar events and notifications of the reservation dates and times), and those calls sound every bit as realistically human as the recordings Google has released so far — my suspicion will be proven false而且我很高兴我如此专注于Duplex的部分原因是,如果它真的像在这些录音中一样工作,它是多年来技术上最惊人的进步之一。

但谷歌并没有这样做,而且我对它的思考越多,谷歌在关于双面打印的新闻查询中的时间就越长,我就越可疑,他们不能即使Duplex仍然具有较低的成功率,如果说一半的呼叫同样有效并且听起来和这些录音一样好,那将是惊人的。对于仍处于开发阶段的技术而言,这是完全可以理解的。

但是Pichai还说“这将在未来几周内作为一项实验推出。”一方面,这让我觉得我也许上午我的摇杆因为如此持怀疑态度Why in the world would Pichai say that if they weren’t at a stage in internal testing where Duplex works as the recordings suggest? But on the other hand, if they are that close, why haven’t they invited anyone from the media to see Duplex in action?

他们确实邀请了来自CNet的Richard Nieva到I / O之前的幕后预览,但他所听到的只是录音

In a building called the Partnerplex on Google’s sprawling campus in Mountain View, California, I’ve been invited to hear a 51-second phone recording of someone making a dinner reservation[...]

As I listen to what sounds like a man and a woman talking, Google’s top executives for Assistant, the search giant’s digital helper, watch closely to gauge my reactionThey’re showing off the Assistant’s new tricks a few days before Google I/O, the company’s annual developer conference that starts Tuesday.

事实证明这个特殊的伎俩很疯狂。

That’s because Person 2, the one who sounds like a man, isn’t a person at all这是Google智能助理。

Why not let Nieva hear it live? Why not let Nieva answer the phone and book the reservation himself, as though he works at the restaurant? If it’s “weeks” away from rolling out in a limited beta to the public, that should be possible.

记者的工作就是验证这些事情,而不只是为了公司的话这是Om Malik,链接到Dan Primack的Axios故事讲述了Google的阻碍

Om Malik

“Google may well have created a lifelike voice assistant…Or it was partially staged或完全不同的东西We just don’t know, because Google won’t answer the questions.” @danprimack doing what journalists are supposed to do验证并深入挖掘!

Dave Winer,在同一个主题中

最后,新闻界开始提出明显的技术问题。

Tech journalism has never asked basic questions like “how did you do this?”

Apple once used my software to demo their tech, which wasn’t ready.

记者拒绝询问此事。

“你是怎么做到的?”是一个必要的问题但更广泛的是,当你只出现录音时,问题是“我们怎么知道这是真的?”

也许Duplex,今天,效果也一样,听起来和这些录音一样人性化但也许它不像他们声称的那样有效,或听起来不那么人性化,1或者从他们发布的剪辑中删除已经编辑的暂停我们不知道,因为谷歌不允许任何人对此进行任何验证这就像一个卡片技巧,魔术师,而不是观众,挑选卡片并洗牌。

比如,观看一个声称的自动驾驶汽车的视频与观看之间的差异 - 或者更好的是,作为乘客乘坐 - 一辆真正的自动驾驶汽车。

上周的头条新闻应该是“谷歌”声明助理可以发出人性化的电话“,而不是”谷歌助理可以发出人性化的电话“有区别。

录音是一个演示您可以演示尚未发货的硬件和软件 - 大多数公司都会这样做,因为那时候产品仍然处于封装状态并且可以产生惊喜但是有义务明确产品的当前状态,并演示您目前“真实”工作的内容私下展示以选择媒体成员是另一种可接受的策略仅仅举一个来自Apple的着名例子:2007年1月,最初的iPhone距离发货还有6个月的时间,仍需要一个批量工作的但史蒂夫乔布斯在舞台上展示的是真实的 - 在原型硬件上运行的早期软件所有演示都是现场直播,而不是录音然后进一步证明,在主题演讲之后,选择媒体成员,包括杰森斯内尔安迪Ihnatko,和David Pogue,即使软件处于某个默认应用程序的早期阶段,也可以使用原型获得长达45分钟的实际操作时间只显示了他们应该看起来的截图

这就是你如何向全世界证明一个演示就是你所说的那样很遗憾谷歌不会用Duplex做到这一点。


  1. 谷歌现在一直声称他们的计划让Duplex认同自己我不明白他们的努力是如何与他们清楚地做出的努力,以使Duplex声音令人信服地成为人类很明显,在主题演讲之后,他们才开始考虑将Duplex作为机器人向人类公开Ethics aside though, what makes the promise of Duplex so tantalizing as a technology is its seeming humanness. ↩︎