在这里,我们探索aigc的前世今生,感受chatgpt、midjourney、stable diffusion等国内外优秀生成式ai工具为电商商品内容制作带来的颠覆性改变,帮助电商企业在aigc大模型时代下向极致工作效率与成本的企业组织迈进。 本期内容提要:
chatgpt、midjourney、stable diffusion、runway四大优秀aigc工具的入门学习;1.大规模参数:ai大模型的参数数量通常在百万级别以上,甚至超过十亿级别,如gpt-3模型的参数数量就达到了1.75万亿。2.深层结构:ai大模型通常采用深度神经网络结构,包含数十甚至数百层,如resnet、vgg、transformer等。3.强泛化能力:ai大模型具有很强的泛化能力,可以从大规模的数据中学习到规律,并在新的数据上表现出色。传统ai模型为判别式模型,即给定特定的数据分布,让模型做出判断,主要应用于人脸识别验证、游戏决策路径、好评差评分析等,令ai从多条路径中判别出某一条。大模型为生成式模型,即给出基础的数据,生成后续的结果与更多内容,如生成文章、生成图片等。大模型促成了大量生成能力的提升,所以不止于原始的单一判别,而能产生更多的结果,此即aigc。aigc作为内容生成新范式,目前可覆盖至以nlp(自然语言处理)对应的文本生成及cv(计算机视觉)对应的图片和视频生成。当下,大家耳熟能详的 chatgpt、stable diffusion、midjourney、runway分别在上述这些领域中有着出色的应用:文本生成领域绝对的一哥——chatgpt
chatgpt是由openai公司开发,基于人工智能技术的聊天机器人。它使用了深度学习技术中的一种网络神经——gpt,该模型是通过使用大量的文本语料库进行训练而生成的,并且可以用于各种自然语言处理任务,例如语言理解、文本生成、机器翻译等。其与电商客服智能机器人有着异曲同工之处,但chatgpt的应用领域更宽泛,作为通用性聊天机器人,可用于教育、健康咨询等各大应用场景之中。1、大量思维建立于语言逻辑之上,chatgpt强大的上下文逻辑能力使得其可以做复杂的思考与判断;3、chatgpt的便捷与易用性,使得其成为增长最快的产品;4、对于多任务和语种的适配及自身普惠性的定位,让任何地区的任何人可以快速地感受到ai带来的巨大震撼。目前,chatgpt可以应用于翻译、摘要、改写、扩展、文案生成、脚本生产、信息检索、对话机器人、情感对话、智能助理等多种场景。当我们赋予chatgpt以电商文案工作者的身份角色进行内容产出时,其将会要求我们提供充分的背景信息,通过不断地沟通对话来明确我们对它目标产出内容的具象化要求,在获取到充分的资料之后,即可快速为我们呈现我们需要的内容:对比两者文案可以发现,chatgpt通过对全网大数据的积累与检索,对平台风格、内容特征及消费者偏好需求十分了解,能够为商家生产出较为适合的文案内容。品牌可以通过对生成文案进行适当修改和润色,调整到最佳结果来进行推广使用。总体而言,chatgpt可以快速提升电商企业文案内容的生产效率。文生图:基于提供的关键词描述,可以生成包括自然风景、建筑设计、产品设计、艺术绘画、插画等任何类型的素材。还可被用在创作故事、写作、教学等领域。
图生图:通过给定一些基础图片与关键词描述,生成对应图片。电商商品内容图片对可控性要求较高,更擅长创意生成的midjourney并不适用。但其凭借出色的创意生成能力,将能在电商与零售领域中的图案、包装、环境等偏向于创意向的设计工作中大放异彩,帮助电商企业显著提升设计效率。midjourney+chatgpt在电商领域能做什么?
我们可以首先通过使用chatgpt得到基础的midjourney prompt参数(关键词),再通过向midjourney输入这些关键词生成简化创意图。举个例子:我们向chatgpt提问:“今年的潮流趋势是什么?”通过对全网数据的洞察,chatgpt给出了它认为的潮流趋势。继续询问:“请你按照刚回复的,设计一件衣服出来”,询问后,chatgpt表示无法直接进行设计,但给出了一些设计建议。
我们可以得到midjourney生成图片需要的关键词接下来,midjourney就可以根据关键词生成简易创意设计图我们可以发现,这些简易设计图虽然不适用于企业的直接生产与售卖,但可以作为测款素材内容帮助品牌预测市场爆款趋势。总体而言,midjourney+chatgpt可赋能企业高效生成创意内容,低成本实现快速测款。stable diffusion与midjourney均为ai图像生成工具,但与更偏向创意侧图像生成的midjourney相比,stable diffusion具有更强的可控性与绝对的开源性:
可控性:不同于midjourney仅能通过关键词指令驱动生成的闭环式图像,stable diffusion在使用时可通过一些额外插件来对细节进行微调控制。
开源性:通过下载stable diffusion开源代码+stable diffusion web ui,即可搭建为自有服务器工具,免费为大量人群提供使用。
通过stable diffusion将《戴耳环的少女》进行二次元化在提示词方面,stable diffusion也可从内容参数与画质参数两个层面进行设置,具备更强的自定义能力:相对于chatgpt、midjourney及stable diffusion,runway在当前的使用成熟度还不是很高,但对于文本生成短视频及文本生成长视频、改风格视频在未来市场的应用仍是刚需,因此作为新兴赛道,runway在该领域具备的先进技术使其仍处于行业领先地位。
实现风格迁移
综上而言,我们可以看到,chatgpt、midjourney和stable diffusion等生成式ai工具的涌现已经可以从较大程度上帮助电商企业提升内容生成速度,降低内容生产成本。那么这些先进工具又将如何进行实际使用?在电商商品内容生成领域是否还有其他优秀aigc工具可以赋能?欢迎大家扫码进行课程订阅,了解更多精彩内容: