极睿科技-pg电子平台

aigc系列专题一 | 揭开chatgpt、midjourney等先进aigc工具的神秘面纱2023.05.23  infimind

hello,这里是极睿科技aigc观察室
在这里,我们探索aigc的前世今生,感受chatgpt、midjourney、stable diffusion等国内外优秀生成式ai工具为电商商品内容制作带来的颠覆性改变,帮助电商企业在aigc大模型时代下向极致工作效率与成本的企业组织迈进。

 本期内容提要:

大模型的简要认识;
chatgpt、midjourney、stable diffusion、runway四大优秀aigc工具的入门学习;

01

关于大模型


首先,让我们先来简要认识下大模型:
什么是大模型?
1.大规模参数:ai大模型的参数数量通常在百万级别以上,甚至超过十亿级别,如gpt-3模型的参数数量就达到了1.75万亿。
2.深层结构:ai大模型通常采用深度神经网络结构,包含数十甚至数百层,如resnet、vgg、transformer等。
3.强泛化能力:ai大模型具有很强的泛化能力,可以从大规模的数据中学习到规律,并在新的数据上表现出色。

大模型与传统ai模型能力的变化(简易视角)
传统ai模型为判别式模型,即给定特定的数据分布,让模型做出判断,主要应用于人脸识别验证、游戏决策路径、好评差评分析等,令ai从多条路径中判别出某一条。
大模型为生成式模型,即给出基础的数据,生成后续的结果与更多内容,如生成文章、生成图片等。大模型促成了大量生成能力的提升,所以不止于原始的单一判别,而能产生更多的结果,此即aigc。

02

四大先进aigc工具认知入门

aigc作为内容生成新范式,目前可覆盖至以nlp(自然语言处理)对应的文本生成及cv(计算机视觉)对应的图片和视频生成。当下,大家耳熟能详的 chatgpt、stable diffusion、midjourney、runway分别在上述这些领域中有着出色的应用:

文本生成领域绝对的一哥——chatgpt

chatgpt是由openai公司开发,基于人工智能技术的聊天机器人。它使用了深度学习技术中的一种网络神经——gpt,该模型是通过使用大量的文本语料库进行训练而生成的,并且可以用于各种自然语言处理任务,例如语言理解、文本生成、机器翻译等。其与电商客服智能机器人有着异曲同工之处,但chatgpt的应用领域更宽泛,作为通用性聊天机器人,可用于教育、健康咨询等各大应用场景之中。
chatgpt在文本生成领域独树一帜的原因:
1、大量思维建立于语言逻辑之上,chatgpt强大的上下文逻辑能力使得其可以做复杂的思考与判断;
2、海量的数据改变了基础的信息检索与获取方式;
3、chatgpt的便捷与易用性,使得其成为增长最快的产品;
4、对于多任务和语种的适配及自身普惠性的定位,让任何地区的任何人可以快速地感受到ai带来的巨大震撼。

目前,chatgpt可以应用于翻译、摘要、改写、扩展、文案生成、脚本生产、信息检索、对话机器人、情感对话、智能助理等多种场景。

电商场景使用举例:
当我们赋予chatgpt以电商文案工作者的身份角色进行内容产出时,其将会要求我们提供充分的背景信息,通过不断地沟通对话来明确我们对它目标产出内容的具象化要求,在获取到充分的资料之后,即可快速为我们呈现我们需要的内容:

chatgpt自动生成小红书文案
chatgpt自动生成直播话术
对比两者文案可以发现,chatgpt通过对全网大数据的积累与检索,对平台风格、内容特征及消费者偏好需求十分了解,能够为商家生产出较为适合的文案内容。品牌可以通过对生成文案进行适当修改和润色,调整到最佳结果来进行推广使用。总体而言,chatgpt可以快速提升电商企业文案内容的生产效率。

文生图:基于提供的关键词描述,可以生成包括自然风景、建筑设计、产品设计、艺术绘画、插画等任何类型的素材。还可被用在创作故事、写作、教学等领域。

图生图:通过给定一些基础图片与关键词描述,生成对应图片。

在电商领域的应用:
电商商品内容图片对可控性要求较高,更擅长创意生成的midjourney并不适用。但其凭借出色的创意生成能力,将能在电商与零售领域中的图案、包装、环境等偏向于创意向的设计工作中大放异彩,帮助电商企业显著提升设计效率。

midjourney+chatgpt在电商领域能做什么?

我们可以首先通过使用chatgpt得到基础的midjourney prompt参数(关键词),再通过向midjourney输入这些关键词生成简化创意图。
举个例子:我们向chatgpt提问:“今年的潮流趋势是什么?”通过对全网数据的洞察,chatgpt给出了它认为的潮流趋势。
继续询问:“请你按照刚回复的,设计一件衣服出来”,询问后,chatgpt表示无法直接进行设计,但给出了一些设计建议。
通过chatgpt对创意关键词的提炼,
我们可以得到midjourney生成图片需要的关键词
接下来,midjourney就可以根据关键词生成简易创意设计图
我们可以发现,这些简易设计图虽然不适用于企业的直接生产与售卖,但可以作为测款素材内容帮助品牌预测市场爆款趋势。总体而言,midjourney+chatgpt可赋能企业高效生成创意内容,低成本实现快速测款。

stable diffusion与midjourney均为ai图像生成工具,但与更偏向创意侧图像生成的midjourney相比,stable diffusion具有更强的可控性与绝对的开源性:

可控性:不同于midjourney仅能通过关键词指令驱动生成的闭环式图像,stable diffusion在使用时可通过一些额外插件来对细节进行微调控制。

开源性:通过下载stable diffusion开源代码+stable diffusion web ui,即可搭建为自有服务器工具,免费为大量人群提供使用。

通过stable diffusion将《戴耳环的少女》进行二次元化

在提示词方面,stable diffusion也可从内容参数与画质参数两个层面进行设置,具备更强的自定义能力:
图片来源于网络
相对于chatgpt、midjourney及stable diffusion,runway在当前的使用成熟度还不是很高,但对于文本生成短视频及文本生成长视频、改风格视频在未来市场的应用仍是刚需,因此作为新兴赛道,runway在该领域具备的先进技术使其仍处于行业领先地位。

实现风格迁移


实现指定命令变化

综上而言,我们可以看到,chatgpt、midjourney和stable diffusion等生成式ai工具的涌现已经可以从较大程度上帮助电商企业提升内容生成速度,降低内容生产成本。那么这些先进工具又将如何进行实际使用?在电商商品内容生成领域是否还有其他优秀aigc工具可以赋能?欢迎大家扫码进行课程订阅,了解更多精彩内容:


aigc系列专题二 | aigc在电商拍摄、作图与排版环节中的落地应用
课程预告 | aigc+电商=极睿科技

了解更多新闻报道 了解更多关于pg电子游戏官网官方网站

网站地图