RTC

618电商万亿订单狂欢幕后的直播平台技术之殇 | 产业观察

经历了疫情带来的半年“空窗期”,这个“618”购物狂欢节格外的热闹,各大电商平台和企业你方唱罢我登场。618当天,天猫和京东累计下单金额均创下纪录,分别为6982亿元和2692亿元。

而在国内疫情减弱后的首个全民大促节点,风口之上的电商直播带货也不出意外的从一众营销策略中脱颖而出。来自淘宝直播的薇娅在整个618活动共直播18场,累计带动GMV高达21.95亿;李佳琦直播带货GMV达13.35亿;快手辛巴6月14日创下直播带货新纪录,带货GMV12.5亿。

此外众多企业大佬和明星跨界直播,董明珠5场直播销售额超178亿,罗永浩抖音618当晚跨夜直播,斩获2597.3万.....电商直播成为当之无愧的主角,俨然成发展数字经济的新抓手。

在这些震撼人心的数据背后,是中国愈发庞大的电商直播用户群体,iiMedia Research(艾媒咨询)数据显示,2019年中国在线直播行业用户规模达5.04亿人,增长率为10.6%,而2020年用户规模预计达5.26亿人。

随着直播带货如火如荼的进行,如此大规模的用户量也给直播平台系统带来了更多挑战,一旦在实时互动中出现音视频不可用,高延时、高卡顿的情况,就会影响到直播的效果,如何用技术手段给用户以良好的观看体验,成为摆在电商直播行业面前的首要问题。

延时、高并发成为主要技术难题

在解决问题之前,我们首先需要了解下这些问题究竟是怎么产生的,以便对症下药。首先是音视频的延时问题,我们可以从一场电商直播中音视频流从主播端到用户端的传输过程来进行分析:

1、主播端延时

主播端的延迟很大程度来自视频流的前处理,例如开播时主播都会用到的美颜软件,美颜其实就是视频前处理的一种,在摄像头采集到人脸视频信息后,会先由美颜进行一个前处理工作,然后再将视频编码传送到服务器上,在这一过程中,无论是前处理还是编码都是需要耗费一定时间的。

2、传输过程延时

传输过程本身就因为网络状况等问题存在一定的延时,如果服务器与服务器之间的网络有丢包,或某台服务器负载过高,都会导致音视频的延时。

除此之外,编码压缩工作也还会耗费一定的时间,当然这部分时间根据不同厂商提供的平台能力、可用性都有些差别,这和系统架构设计、运维能力都息息相关。

3、用户端延时

用户端的延时一方面要考虑到用户的网络状况,另一方面也要考虑到用户的硬件系统能否支持,一些老旧的机型在进行解码处理时,由于CPU被大量占用,很容易发热发烫,导致手机卡顿。

直播的延时就是在这些过程中慢慢积攒的,美颜需要合成处理的时间、传输需要一定的时间,音视频压缩合成需要一定的时间,视频分发还需要一定的时间……在遇到网速和服务器出现问题时,延迟可能会进一步增加。

而电商直播系统开发中比较常见的“高并发”问题就比较好解释了。正常情况下,直播平台可以很稳定流畅地为用户提供服务。

但一旦遭遇618、明星直播等特殊情况,流量以平时的百倍、千倍甚至万倍的规模进入,所谓的高并发问题就出现了,如果在平台的开发过程中,没有考虑到并发量的问题,那么就会造成服务器的崩溃,导致观看失败,影响直播用户的使用体验。

WebRTC协议

解决直播延时的新武器

问题并非仅此而已,事实上当前中国仍旧有80%的移动环境处于弱网状态,基本上所有的移动直播,内容传输上都会很困难。相关数据显示,有超过7成的视频从业者认为,延迟和卡顿阻碍了直播行业的整体发展。

所以最理想的直播状态当然是在保证高清晰度的同时做到音视频的低延时和高流畅,这就意味着,延时最大不超过500ms,数值越小越好。而延时反应到包括电商直播在内的直播场景中时,主要看2个核心指标:首开时间和再缓冲时间。

首开时间即从打开到看到视频画面的时间,会受域名解析、连接、首包时间的影响,首播时间控制在1秒内算是不错的效果。其次是再缓冲时间,是用户观看视频时的卡顿时间。

既然延时对于直播如此重要,那么延时问题该如何解决呢?

其实,经过这些年的发展,我国的直播技术已经趋于成熟,通过多种专为流媒体开发的协议和技术手段来优化延时问题。经过多年的沉淀,目前国内主流的有RTMP和WebRTC两大阵营。

RTMP 对底层的优化非常优秀,适合长时间播放,同时它 Adobe Flash 支持好,基本上所有的编码器(摄像头之类)都支持 RTMP 输出。

另外RTMP最大的特点是与CDN的强绑定,借助CDN的负载均衡系统将内容推送到接近用户的边缘节点,使用户就近取得所需内容,提高用户访问的响应速度和成功率,解决因分布、带宽、服务器性能带来的访问延迟问题,目前RTMP一般延时在 3s 左右,对于标准的直播场景来说是够用的。

当然,虽然RTMP具备集成方便、兼容性较好等优势,但在延时问题上依然不能满足日益攀升的需求,于是WebRTC因其低延时和无卡顿的特性而备受关注。

WebRTC是一种基于浏览器的实时通信的开源解决方案,使用UDP私有协议来进行媒体推流,而不需要创建离散的媒体段;并且它是面向无连接的,没有TCP连接断开时的挥手确认连接关闭的机制。 

基于这两点,WebRTC能够做到毫秒级的低延迟,远远低于基于RTMP协议的 CDN 分发的延迟。而且,它直接通过浏览器就可以完成推流和播放。

因此,WebRTC协议针对有高互动性要求的电商直播场景尤为适宜。以我们熟知的淘宝直播为例,其在19年推出的超低延时直播服务RTS方案就是基于WebRTC实现的,可以为用户带来端到端延时1秒内的低延时直播体验。

当然WebRTC要实时超低延时也是需要多种技术来辅助的,RTS服务就针对全链路直播指标进行监控和针对性优化,以及通过智能调度系统以及网络拥塞、抗弱网优化、缓冲策略等进行一系列底层核心技术优化。

另外,国内知名的第三方通信云服务商融云提供的RTC解决方案也是基于WebRTC来实现的。在通信协议层面保障音视频传输的稳定性和流畅性。

同时在底层架构设计上,融云RTC智能路由可以在复杂的互联网环境下,实现客户端实时网络探测,选择最近的Media Server(媒体服务)节点接入,大幅度提升连接速度。

对于弱网下如何解决延迟问题,融云也提供了一些公开的策略供开发者参考。其中最核心的策略就是迅速预估带宽变化,根据带宽自动适配码率,来确保音视频流畅优先。

准确来说就是在网络链路发生丢包以前就监测到网络拥塞情况,再通过 NACK(丢包重传)、FEC(前向纠错)和动态调整码实现自适应带宽控制,以及通过接收端 Jitter Buffer(媒体流平稳)实现自适应抖动缓冲控制,在提升速度的同时保障通话质量。

融云自研的丢包补偿策略还可使接收端定期通知发送端自己未接收到的包,发送端在发送缓冲区找到对应的数据包,重新发送到接收端,确保音视频的传输质量。

通过这些先进的技术架构和自研的多项技术策略,融云音视频全球范围内的端到端延时小于 400ms,最低延时 66ms,从而保障端到端之间延迟无感知的实时互动。

高并发引出的架构话题

高并发问题主要是考验音视频服务的设计架构,是否能够在激增的流量冲击下实现平稳运行。

从直播角度上来讲,若在某个时间点,直播平台能够承载大量的线上观看人数而不影响播放品质,说明该平台在出现高并发情况时,优化的比较到位。

举个例子,某平台邀请流量鲜肉进行直播带货,由于用户涌入过猛(如观看人数上升,弹幕消息爆发等),很容易导致画面卡顿甚至导致服务器宕机。

所以在融云首席架构师李淼眼中,一个优秀的架构应该具备以下特征:

第一、伸缩性

伸缩性就是保证在业务不中断的情况下,可以平滑地进行各种服务。优秀的架构应该具备良好的伸缩性,所谓的“伸”,是系统在运行中业务量上来了,这个时候需要添加服务器,在业务不中断的情况下,可以平滑地把整个集群扩大,承载相应的业务量。

所谓的“缩”,是指在服务器处于空闲状态,保证业务不中断的前提下,可以把资源再降下来,避免浪费。

第二、高可用

当服务出现问题时,可提供容灾、自动切换、自动恢复等机制,减少停工时间,保证服务不间断地持续对外提供支持。

第三、扩展性

很多人容易混淆扩展性和伸缩性这两个概念。所谓扩展性,就是灵活地对业务进行变更。比如,在保证业务不中断的情况下,可以平滑的上线新功能,对用户来讲如果感知最小,那它的扩展一定很灵活。

第四、高性能

是指在固定的资源下可以承载更多的业务,这个也是开发人员一直追求的。

此外,服务器耦合的问题也在音视频架构中长期存在。业界现有的实时音视频普遍基于分布式有级联的 RTC 架构——信令服务器与媒体服务器紧密耦合,这种设计模式下如果媒体服务与信令服务之间存在异常状态,就会导致整个音视频通话中断,用户间信息传输的稳定性、可靠性难以保障。

但在融云实时音视频服务中,分布式的去中心化RTC通信架构可使信令服务与媒体服务解耦,彼此无依赖,确保当用户数激增或者流量激增的时候,能够快速的去扩展这些节点,很好地解决了延时和稳定性问题,保证直播业务能够稳定的运行。

对于电商直播的高并发,还有很重要的一点是直播间聊天室的属性实时同步的问题,在线人数、累计人数、商品链接与列表等信息,需要不断访问和请求服务器,并将数值进行返还,而数值频繁变化,无论是轮询还是通知,都有高并发压力。

所有在聊天室里面的需要展现的内容,都可以通过融云的聊天室属性管理服务来实现,无需频繁地访问服务器即可自动获取相关信息,可大大缓解电商平台的服务器压力。

电商直播不仅仅是音视频技术的应用

实际上,除了音视频技术来保障直播质量之外,电商直播对于即时通讯和推送同样有着极高的需求。

比如说,电商直播中的聊天室,让用户可以在弹幕上与主播和粉丝互动,这就是很纯粹的即时通讯技术应用,用户在直播间的提问、点赞、下单等行为背后都需要即时通讯技术,而用户收到直播通知、购买成功通知等App的推送消息,同样是需要即时通讯技术来实现。

因此在应用内构建一套完整的直播体系,需要实时音视频、即时通讯等多种能力。对于直播系统的开发人员,还有一个痛苦是:如果通信的能力是分散的,集成了不同的厂商,如果出现问题,就要找好几个服务商去协调,这是很常见的。

比如说直播平台有时候碰到一个通信层面的问题,因为IM和音视频在很多场景下它是有耦合的,例如呼叫的信令,一般会通过IM消息去下发,然后把音视频呼叫起来,媒体流再进行一些中转。

如果是IM和音视频分别由两个厂商来提供能力,出现了这些问题之后,平台就要找不同的厂商去判断。

所以在服务体系上面,对于开发人员来说成本也很高,所以从业务集成和服务这两个角度,其实使用同一个厂商的一套SDK,这些东西对于平台来说成本都是最低的,集成的效率也最高。

融云在近期全面升级实时音视频服务能力的同时,也推出了“IM+RTC+推送”的通信一体化解决方案,致力于用一套SDK解决电商直播等通信场景,充分满足电商直播业务中对于即时通讯与实时音视频的多元化需求。

例如知名奢侈品电商寺库的直播平台就是依托于融云互联网通信云来实现的,通过融云“IM+RTC+推送”的通信一体化解决方案,为用户带来了稳定流畅的直播体验。

同样是在618期间,广州直播电商狂欢节思埠专场在全网顶级网红的号召力下,有海量客户进入直播间互动并购买商品。

当接到客户的需求后,融云技术服务人员动态调整服务器部署,并针对客户实际情况量身定制相应的保障方案,帮助平台平稳度过业务峰值期,确保直播活动的顺利进行。

电商直播的未来在何方?

一方面,新技术将继续变革直播的形态。随着5G、超高清、VR、边缘计算等技术发展,低时延、大流量、高并发将成为常态,主播与观众的互动将更加实时、丰富和有趣。特别是5G时代的到来,无疑将会给电商直播带来全新的变革。

1.更清晰

此前,淘宝主播“大大大雪梨”在浙江完成了全国首场5G电商直播。据报道,通过超清4K画面,消费者不仅能看到直播间的整体情况,还可以对局部细节进行放大,让商品实时展示更为清晰、直观。

2.更快速

使用5G技术直播,相对4G而言,5G用户上行平均速率可达4G的十倍至百倍以上,现场每一帧直播画面都能实时传递。

3.低延时

即使是目前最先进的技术,在最优的网络环境下,直播延时也会达到几十毫秒,而5G的毫秒级低延时让人们几乎感受不到网络延迟的存在。

4.更稳定

4G时代的网络需要同时一起传输各种数据,这些数据会互相争夺挤占带宽资源,体验感会变差。

而5G切片技术的出现可以直接将一个物理通道分成多个虚拟通道,直播信号可专用其中一个资源独享的虚拟通道,实现固定带宽和高可靠性,能够保障视频直播的正常进行。

另一方面,融云在长期的市场观察中还发现了一个新的趋势:小程序正在成为直播带货的新战场。

当前,淘宝、抖音、快手等各大平台的直播带货如火如荼,头部和腰部主播的热度居高不下,坑位费普遍上涨,卖货的佣金比例也有所增加,按照二八法则,后入者的门槛相对变高。于是,不少商户和品牌主把小程序作为直播带货的第二战场。

艾媒咨询数据显示,2019年微信小程序电商用户预计将达2.40亿人。微信平台红利及小程序的诞生,为移动电商发展提供强大助力。

背靠微信成熟的生态和巨大的流量池,兼具强社交和易传播的优势,借力小程序高效连接线上和线下,把零售电商的核心要素充分联结起来,实现私域流量池的建立和变现。

无需安装、触手可及、用完即走、裂变分享,小程序直播,无疑将成为电商的必争之地。


0 个评论

要回复文章请先登录注册