准备迎接生成式人工智能的科技领袖指南
关键要点
生成式人工智能Generative AI正在迅速发展,科技领导者需要积极准备。这篇文章探讨了如何在云端构建基础、处理数据质量、深入思考伦理和透明度等方面做好准备。通过提升团队的技能、识别具体用例,科技领袖可以更好地迎接这一新技术的挑战。
我们往往会高估技术短期内的影响,而低估其长期影响。
罗伊阿马拉Roy Amara
我对历史上那些引发公众想象力的技术转折点感到着迷比如第一场电视广播、载人航天飞行或视频会议。这些事件让之前难以触及的技术或概念变得具体可感。正如阿马拉所言,这些事件的背后往往有着无数的误判和夸大的期望。当一个转折点到来时,通常伴随着几十年看不见的努力,这可以用创新的S曲线来描述。想想过去有关虚拟世界普及的承诺。尽管期望超过了现实,但那些积极探索并将自己置身于真实商业问题如客户需求提供更身临其境的体验的组织和领导者,更能为虚拟世界的主流化做好准备。

目前最显著的新兴技术就是生成式人工智能。公众似乎觉得生成式人工智能从无到有,但如果深入挖掘,你会发现其背后的理念可追溯至1958年发布的Mark I感知器和20世纪末的神经网络。
迅猛兔加速器统计技术的进步、公开数据的快速增长以及云计算的强大能力,都是推动生成式人工智能成为可能的关键因素。你可能遇到两个与生成式人工智能相关的术语:基础模型Foundation Models,FMs是训练于大量结构化和非结构化数据的机器学习ML模型,可以针对特定任务进行微调或适配。大型语言模型Large Language Models,LLMs是FMs的一个子集,专注于理解和生成类人文本。这些模型非常适合诸如翻译、回答问题、总结信息以及创建或识别图像等需求。
AWS与生成式人工智能
AWS多年来一直在多个领域投资并使用基础模型,例如在Amazoncom上的搜索和通过Alexa提供对话体验。你可能看到过AWS在生成式人工智能方面的公告,所以我不再重复这里的内容。在新技术围绕的炒作和营销中,清晰的高管对“是什么”和“为什么”的理解至关重要。
自2017年推出亚马逊SageMaker以来,机器学习和人工智能服务不断丰富,使这些工具的可达性扩大到科技人员和非科技人员。AWS的使命是扩大技术接入,因为这些技术有着深远的影响。最近的公告继续沿着这一使命,以更开放的方式提供企业所需的能力。例如,Amazon Bedrock的方法将为预先训练的模型提供广泛的访问权限,企业可以用自己的数据进行定制,保障数据隐私,同时利用云计算的力量安全地大规模交付能力。各公司无需考虑模型的托管、训练或监控,而是可以专注于驱动的成果。
Amazon Bedrock意识到仅靠一个解决方案或模型是不可能解决你面临的所有商业问题的。支付给公共模型的机密数据的高昂成本已被一些公司所体验。
虽然生成式人工智能既不是银弹,也不仅仅是“更好的搜索引擎”,但显然其潜力巨大。想象制药公司加速基因治疗的设计,借款人与抵押贷款提供商之间能够进行逼真的对话体验以快速获得贷款,或是每个人都能通过获取持续的知识和教育路径而获得机会。作为一名几乎合格的业余coder,我期待着通过生成式人工智能提供的实时建议提升我的技能。
作为首席信息官、首席技术官或首席数据官,你应该考虑什么?又该如何准备?以下是我们认为重要的一些主题。
专注于云计算之旅
你还记得那些幼年时看的电视节目吗?其中有些总是警告:“这不要在家尝试。”对于生成式人工智能,我想提出一个变体:“没有云计算就不要尝试。”你希望你的团队专注于解决问题和创新,而不是管理基础设施和许可证的复杂性与成本。云计算为生成式人工智能提供了条件,能够提供高性价比的数据湖、可持续配置的GPU和计算能力、高速网络以及按需付费的成本。结合AWS Trainium和AWS Inferentia芯片组提供的计算实例,可以在模型训练和推理上实现较低成本、更高性能和更优碳足迹,相比于本地解决方案,这样的选择更具现实意义。
现在就建立数据基础
用不牢固基础建造的房子是无法长久的,这在机器学习ML领域同样适用。对于生成式人工智能而言,数据质量优于可用性。
虽然技术债务通常是个热门话题,但我们必须意识到许多组织在数据上无意识地积累了类似的债务。通常是由于数据质量不佳、数据源碎片化或孤岛现象、数据素养不足、对数据如何集成到产品中的前期考虑不足,以及一种讲数据但日常不使用数据的文化。现在是时候实施这些基本原则了其中许多在我以前的博客文章中提到过,其中包括数据领导者的关键性。毕竟,推动机器学习落地的大部分时间仍然花费在数据整理和标注上。
超越技术的思考
生成式人工智能的世界让人兴奋,但技术很少是在真空中运作的。我们必须面对意外后果的法则。首先要考虑的是你对伦理、透明度、数据归属、安全和隐私的立场。你如何能够确保技术的准确、公平和恰当使用?有资源可供参考,例如迈克尔科恩斯Michael Kearns的《伦理算法》一书,但光靠这些是不够的。这也是一个真正行动的好机会!例如,重点关注技能和世界观的多样性,确保参与模型创建和使用的人员能够代表你的客户的多样性,这有助于确保相关性和提前识别潜在偏见。
在这些考量上培训团队,将其融入治理与合规框架,甚至融入供应商选择过程,以选择与你价值观相符的合作伙伴。
提升自己和员工的技能
人工智能既能引起兴奋又会让人担忧。它打开了一个知识、创新和效率的新世界,但也让许多人对职业安全感到困惑。随着人工智能作为一种深远影响工具的持续涌现,我们需要考虑哪些技能可能在未来不再需要,哪些又会变得更受欢迎。考虑所需的技术技能,以及如何将其融入到组织中。像机器学习大学这样的项目可以提供帮助,但重要的是要从更大的视角进行思考。批判性思维和解决问题等技能将变得更加重要。我们最终希望人们能够借助人工智能解决实际商业难题,批判性地评估和质疑机器学习模型的推论。这对生成式人工智能模型尤其重要,因为它们浓缩了数据而不是提供经过深思熟虑的答案。通过逐步和持续地消除低价值工作,创造空间来练习这些技能或许可以通过使用机器学习来实现这一点!
提升技能不仅仅是个人能力的提高。根据汤姆达文波特的研究,35的首席数据官发现,开展数据和人工智能互联项目是强大的变革工具。单靠数据孤岛试图单独创造价值的做法已经让位于开展跨组织的倡议。这种功能导向的方法有助于加大数据倡导和对未来可能性的热情。
开始考虑用例
我喜欢这句谚语:“爱上问题,而不是解决方案。”这提醒我们,尽管技术是一种绝妙的推动者,但只是我们应用于现实问题的一种工具。
生成式人工智能可以帮助解决哪些耗时、困难或不可能解决的问题?你是否拥有有助于这一过程的数据?可以大胆设想机会,但从引起日常困扰的小问题做起,这就是我们所称的“纸上划伤”。这些恼人的问题是否可以被自动化解决,释放组织的时间,同时提高对人工智能的理解?
例如,开发人员可以利用Amazon Code Whisperer了解生成式人工智能在提高生产力方面的能力,同时针对不熟悉的API提供安全的编程建议等。内部基准显示,生产力可提高57,同时任务完成率也提高了。这是一个在组织中成为生产力英雄的绝佳机会!
最后,兴奋之余要保持冷静。我们正处于大型语言模型的重要交叉点。有时候感觉我们对人工智能的了解越多,实际上知道的却越少。以开放和好奇的心态来接触生成式人工智能,但要避免浮夸的宣称。批判性地评估你读到的内容,不要相信会有单一最佳模型可供采用。最佳方法,以及我很高兴看到AWS通过Amazon Bedrock所采纳的,就是认识到不同的基础模型将服务于不同的需求。这为所有开发者民主化了接入,允许商业和开源的基础模型被采用。那些已经在人工智能领域有经验的人会意识到,提供多种模型的AWS云计算平台比押注在单一模型上要更有效。
Phil
进一步阅读
宣布新工具以在AWS上构建生成式人工智能,Swami Sivasubramanian 让你的人工智能愿景成为现实的指南,Tom Godden 在企业中激活机器学习:与亚马逊机器学习解决方案实验室副总裁米歇尔李的访谈,Phil LeBrun 机器学习大学 优先考虑数据价值创造,Phil LeBrun标签 人工智能、机器学习