下载本文的PDF版本 PDF

VoIP:它有什么用?

如果您认为 VoIP 只是电信业务的 IP 版本,那就再想想。 大量应用程序正在改变我们所知的电话通话。

SUDHIR R. AHUJA 和 J. ROBERT ENSOR,贝尔实验室/朗讯科技

VoIP(基于IP的语音)技术是一个快速扩张的领域。越来越多的 VoIP 组件正在被开发,而现有的 VoIP 技术正以快速——且仍在加速——的速度部署。这种增长由两个目标驱动:降低成本和增加收入。

网络和服务提供商将 VoIP 技术视为降低其提供现有语音服务和新的多媒体服务成本的一种手段。服务提供商还将 VoIP 基础设施视为构建新的创收服务的经济基础。随着 VoIP 技术的部署变得普遍,并成为共同竞争格局的一部分,第二个目标将变得更加重要,服务提供商将努力扩大其市场基础。

当前和设想的大多数 VoIP 服务都是所谓的融合服务,集成了来自多个现有服务的功能和特性。通常,传统的基于语音的电话服务的功能与数据网络服务中的功能相结合。例如,点击拨号服务允许用户通过在个人计算机上运行的 Web 浏览器控制电话呼叫。融合服务还可以为用户提供新的媒体集成。例如,多媒体会议服务允许用户通过呼叫相互交互,在呼叫中他们交换音频和视频信息(即,新版本的可视电话)。

融合的电话-Web 服务的日益增长的机会正在推动电话网络和数据网络的融合。VoIP 服务也在推动另一种网络融合:无线网络和有线网络的集成。更普遍的网络融合似乎是可能的。由于 IP 网络可能相对便宜,因此鼓励网络提供商构建由各种接入网络包围的通用 IP 核心网络。这些接入网络(无线、有线、电缆等)可以共享 IP 核心资源,从而降低向具有不同接入设备的客户提供通用服务的成本。

许多引人入胜的 VoIP 服务已经可用,服务提供商正在计划更令人兴奋的服务。IP 网络和 IP 端点设备的持续部署将进一步促进新服务的开发。此外,随着 IP 端点的处理能力不断提高——使它们能够直接处理网络访问控制、多种数据格式和转换——更具创新性和便利性的服务将成为可能。本文介绍了一些目前正在部署的值得注意的服务,并重点介绍了一些有趣的未来服务。

创建新服务

传统电话服务——通过公共交换电话网络 (PSTN) 向客户提供的服务——建立在高度结构化的技术基础上。该基础的创建和优化旨在支持使用模拟电话的语音呼叫。该基础为应用程序开发人员提供了集成的信令/媒体传输(带内信令)以及一组有限的信号处理程序和媒体处理器,这些处理器通过其交换电路连接与其他网络隔离。由于电话支持非常有限的信令机制,因此 PSTN 服务的调用和控制一直很笨拙。某些服务通过拨打特殊的电话号码(例如 800 或 900 号码)来调用。PSTN 服务通常通过带内信令调用和控制,带内信令通常通过触摸音调(DTMF,双音多频)或语音(IVR,交互式语音应答)激活。

PSTN 服务提供商所需的基本控制和媒体处理必须由特殊的网络元素(信令控制点、服务节点等)执行。

图 1 说明了呼叫中心服务的关键组件。在此图中,800 服务器是一个服务节点;它是一个应用程序服务器,通过 SS7(7 号信令系统)信令协议与 5 类和 4 类交换机通信。此服务器仅处理控制消息,而不处理语音本身。它可以帮助根据其已实现的功能建立语音呼叫的最终路由。例如,它可以确定呼叫是路由到公司的呼叫中心还是其零售网点之一。

服务提供商可能需要网络元素不支持的控制和媒体处理。这种额外的处理必须在呼叫端点处理。信息流入和流出端点的通道是通过语音通道本身,因此必须在音频控制(例如,与人工接线员的对话、DTMF 或 IVR)上构建专门的控制。在图 1 中,这些端点应用程序服务器由呼叫中心 IVR 服务器表示,该服务器终止语音连接并通过使用 DTMF 或语音识别的带内信令进行通信。

VoIP 技术为构建通信服务提供了更丰富、更灵活的基础。IP 网络支持信令和媒体流量的独立连接。信令和承载流量的这种解耦消除了信息流之间的干扰;不需要带内信令。因此,与应用程序服务器的通信得到了简化。

此外,IP 网络拓扑允许任何节点充当服务器。因此,位于一个或多个服务提供商域中的多个应用程序服务器和用户端点可以通过 IP 进行通信以参与服务支持。

最后,IP 传输由各种底层网络提供,不同的网络技术可以支持不同的服务集。例如,DSL 和电缆网络提供支持实时语音、数据和视频服务的宽带 IP 连接。因此,这些网络提供商可以向其客户提供“三重播放”服务。

图 2 显示了如何使用 VoIP 技术实现呼叫中心服务。在该图中,用户端点是连接到有线或无线接入网络的电话(非基于 IP 的设备)。IP 骨干网通过边界元素(例如,媒体网关)连接到这些特定的接入网络。这些网关终止用户的语音呼叫;它们处理用户的所有 TDM(时分复用)语音流量。网关识别来自用户的 DTMF 信号,并将它们转换为基于 IP 的应用程序服务器的 SIP(会话发起协议)消息。此外,它们在用户的 TDM 语音有效负载和 RTP(实时传输协议)媒体数据包之间进行转换,媒体处理器使用这些数据包。多个基于 IP 的应用程序服务器协同工作,通过 SIP 信令协调其活动,以提供呼叫中心服务。软交换机包含一个 SIP 代理来支持这种 SIP 协调,并且它包含媒体控制功能来支持媒体处理的协调。应用程序服务器可能在地理上分布,并且与端点和交换机分离。例如,网站可以使用存储的语音或音乐文件来提供公告。它们可以充当保持音乐服务器;不需要单个公告服务器。

VoIP 技术为通过组件的不同组合创建许多新的融合服务奠定了基础。例如,IVR 和 Web 组件可以组合——使用 SIP 作为通用信令协议——以创建可通过 Web 浏览器或 IP 电话以及仅语音电话访问的呼叫中心服务。类似地,IVR 服务器和 SMS(短消息服务)可以组合以创建包含 SMS 消息的呼叫中心服务。用户将能够通过他们的任何访问机制访问这些呼叫中心服务,甚至可以同时使用多种访问技术来提供更好的服务。或者,SMS 系统可以与基于 Web 的信息服务器组合以创建 MMS(多媒体消息服务),其中消息可能包含基于 Web 的信息,并且可以由 Web 浏览器检索。

新的控制和协调

融合服务可以利用一组服务中的功能来控制另一组服务中的各个方面。例如,点击拨号服务将基于 Web 的用户界面与电话服务器结合起来,以创建 Web 可控电话。这些服务允许用户选择(突出显示)嵌入在网页中的电话号码,指示应呼叫这些号码。此类服务是通过组合 PSTN、IP 网络和基于 IP 的服务器构建的。

图 3 显示了典型的点击拨号服务的工作原理。当客户使用他们的 Web 浏览器单击网页中的电话号码时,他们的计算机通过数据包网络向基于 IP 的点击拨号服务器发送消息。此服务器反过来使用其与 PSTN 的连接来拨打给客户和客户正在拨打的号码的电话。然后,这些呼叫通过 PSTN 控制元素桥接到单个呼叫中。

此示例说明了 VoIP 服务的一个重要特征:它们可以作为多个服务器的集合来构建。这些服务器通常将其协调建立在 SIP 信令的基础上。然而,SIP 仅提供了一种在适当服务器之间定位和同步初始交互的方法。一旦服务器通过 SIP 会合,它们必须通过适当的专用协议交换特定于应用程序的信令。在此示例中,点击拨号客户端和 Web 服务器必须交换约定的协议(通常包括 HTTP),以便可以将网页传输给用户。此外,点击拨号客户端和点击拨号服务器必须交换约定的协议,以请求和控制所需的电话功能。

服务协调和组合成为 VoIP 服务开发和执行中的重要问题,因为通常涉及多个应用程序服务器。行业必须开发技术来协调会话中不同的服务元素。一个根本问题是服务行为难以正式且方便地描述,这使得服务协调劳动强度大。一个相关的问题是,用于创建服务的多个服务器可能不在同一网络中。因此,一个服务提供商可能不愿意为另一个提供商发布其服务器的详细信息。另一个困难是服务可能会相互干扰。例如,如果会议参与者暂时离开,生成保持音乐,则此行为可能会干扰甚至阻止其余参与者继续会议。

新的媒体集成

许多 VoIP 服务都基于多种媒体的集成。一种这样的服务是多媒体会议,可以通过利用 SIP 信令和 IP 传输来实现。SIP 消息可用于服务器注册和会合,以及设置、进行和结束会话所需的控件。附加的 IP 控制消息用于发送特定于媒体的命令。例如,服务客户可以使用这些命令来选择视频源、更改编解码器、更改多播组等。IP 传输用于将表示各种媒体的数据移动到服务器和用户之间以及从服务器和用户之间移动。

图 4 说明了会议服务。该系统在总体结构上与图 3 中描述的 IVR 服务类似,但它基于一组不同的服务器:多媒体会议服务器、音频桥、视频服务器和数据共享服务器。会议服务器协调特定于数据的服务器的活动,这些服务器操作与适当媒体对应的一组不同的数据包数据。例如,音频桥接收来自所有参与者的编码语音,并将组合的语音数据分发回参与者。如图所示,不需要端点设备的一致性——每个客户都可以通过不同类型的端点(例如,手机、模拟电话或笔记本电脑)参与会议。传输到/从每个参与者的媒体取决于参与者的端点设备的功能。

QoS(服务质量)是基于 IP 的多媒体服务的一个重要问题。许多当前的 IP 服务在没有底层网络提供商的 QoS 保证的情况下已得到部署。这些服务之所以成功,是因为传输质量足以满足客户需求。然而,这些服务的提供商无法保证他们的服务可以增长以满足更大的客户群的需求,同时还能满足服务的时间限制。例如,基于 IP 的语音和视频服务正在企业中部署,而没有明确的 QoS 支持。由于用于传输的企业 LAN 具有足够的带宽来允许为实时语音和视频进行过度配置,因此这些服务是成功的。然而,及时传输时间敏感数据以支持跨全球网络的实时多媒体对话更难保证。

我们必须通过使用足够的传输性能和信令和媒体传输路径中的服务器来解决这些问题,这些服务器可以在实时约束内对消息做出反应。这些服务器必须在时间范围内处理信令和承载流量,以满足与转码、合成、分发等相关的处理需求。目前,能够进行这种处理的服务器仅对某些功能经济高效。

会话的新用途

SIP 会话可以是长期的,持久会话为一些有趣的新 VoIP 服务提供了基础。一个例子是增强型聊天室服务,称为 Telechat,如图 5 所示。

在此应用程序中,用户可以在多媒体会议期间通过语音、视频和数据进行交互。他们还可以交换私人和公共(广播)消息。用户可以在共享存储库中创建和访问存储的数据。数据可以从其他应用程序导入,在聊天会话期间生成,并在多方会议期间或会议外访问。服务会话不限于呼叫,因此它们可以是长期的,可以跨越多个呼叫或其他较短的会话。这些较长的会话可以构成持久状态和数据存储的基础。

持久会话支持长期交互——并且可以充当多个呼叫的会合点。此外,持久会话可以为这些呼叫中使用的数据提供存储。因此,持久会话可以充当长期团队努力的直接表示。增强型聊天室服务可以建立在持久会话的基础上,持久会话可以维护在多个聊天会话范围内稳定的房间状态。这种持久状态为一系列聊天会话创建了上下文或周围环境。

持久会话为系统设计人员带来了新的挑战。开发人员必须决定在哪里维护会话状态,会话状态可以分布在网络服务器和端点之间,也可以限制为这些元素的子集。设计人员还必须决定在哪里存储与会话关联的数据。例如,在 Telechat 中,会话状态存储在多个服务器上。在一个相关的问题中,服务提供商必须决定谁拥有什么数据。持久状态存储所需资源的计费也是多个设计决策的来源。例如,服务提供商必须指定加入长期会话的人员是为会话付费还是为与会话的连接/交互付费。

仅仅是开始

VoIP 是一项颠覆性技术,正在对语音通信服务的交付方式造成重大改变。它为电信网络提供了未来的路线图。这仅仅是更重要的融合趋势的开始。随着世界转向通用的基于 IP 的数据网络作为骨干网,VoIP 只是此类网络上提供的实时服务之一,以及许多数据服务。同一网络还将支持从视频会议到娱乐视频的视频服务。

更重要的是,这些服务允许在控制和用户级别实现融合。用户可以从 Web 发起呼叫或电视节目,然后从摄像手机向用户的家庭网站发送视频。通用的基于 Web 的服务可用于配置用户的个人选择。显然,这仅仅是 IP 上提供的全多媒体令人兴奋的服务的开始。

一个重要的架构变化是,所有应用程序服务器都将移出特定网络,并变得更加独立于访问。网络将成为多服务平台。为了有效地做到这一点,网络必须提供灵活的 QoS 机制和创建虚拟网络以匹配正在部署的服务的能力。这正是许多 VoIP 挑战仍有待解决的地方。具体而言,我们仍然需要方法来指定特定应用程序(例如,多方音频会议)的网络要求,并且我们需要能够将其映射到多服务网络。最后,我们需要能够配置此类服务并监控其执行以保证交付。

最后但并非最不重要的是,将日益智能的端点和基于端点的应用程序与前面介绍的以网络为中心的视图集成起来的挑战。除了新的服务交互问题外,这还引发了许多关于用户数据所有权、身份验证、服务计费以及安全责任的新担忧。

VoIP 已经到来,并且已经引领潮流,不仅带来了更便宜的语音呼叫,还带来了一系列新的应用程序。我们需要关注挑战,以实现一系列新的多媒体应用程序。

 

什么是 SIP?

SIP(会话发起协议)是一种基于文本的协议,用于发起用户之间的通信会话。这些会话可能包括与传统电话的呼叫、语音、视频和数据呼叫、多媒体会议、流媒体服务、游戏等。SIP 由互联网工程任务组 (IETF) 管理的一系列请求评论 (RFC) 定义。

SIP 消息在两个或多个对等方(IP 节点)之间交换,用于会合和同步,从而支持启动交互式通信会话。

一旦通信方通过 SIP 消息启动了他们的会话,他们就可以通过特定于会话的消息交换进行会话。这些方也可以使用 SIP 进行其他会话事件,例如添加和删除会话成员、更改媒体和结束会话。

SIP 从根本上来说是一种对等方之间通信的协议。SIP 会话由两个或多个通信方进行。这些方可以是网络端点(与最终用户设备关联的 IP 节点)以及网络服务器。如果一个 SIP 节点知道另一个节点的地址,则第一个节点可以邀请第二个节点加入 SIP 会话。因此,SIP 会话不需要网络服务器的支持,但网络中介通常会帮助端点彼此查找。用户向 SIP 注册器注册他们的网络地址。用户通常通过 SIP 代理向彼此发送会话邀请,SIP 代理使用注册信息来定位被邀请者。

SIP 会话为各种各样的交互提供了一个可扩展的框架。它们不定义——因此,也不约束——专门的服务行为。因此,它们构成了许多不同通信服务的基础。SIP 会话支持通常通过数据包数据网络访问的服务(例如,流式视频点播服务)。它们还支持传统的电话服务(例如,会议语音呼叫)。

由于 SIP 是一个已经开发了电话和非电话服务的框架,因此 SIP 鼓励了服务的融合。特别是,SIP 正在鼓励电话和基于 Web 的服务的融合。这些融合服务包括 Web 电话、基于 Web 的电话服务管理以及玩家可以在会议呼叫中相互交谈的交互式游戏。

更多信息可从 IETF 的 SIP 工作组获得,网址为 http://www.ietf.org/html.charters/sip-charter.html

喜欢还是讨厌?请告诉我们

[email protected]www.acmqueue.com/forums

SUDHIR AHUJA 是贝尔实验室/朗讯科技融合网络和服务研究实验室的副总裁,他在那里领导融合网络、服务、语音识别、文本到语音编码技术、基于视频的通信以及新型多媒体应用程序的研究。他设计并开发了贝尔实验室的第一个大型多处理器,并倡导了第一个基于互联网的视频会议系统。他目前的兴趣领域是互联网上的通信应用。

Ahuja 获得了莱斯大学电气工程专业的硕士和博士学位。他的本科学历是在印度理工学院孟买分校获得的,在那里他获得了总统金质奖章,以表彰其杰出的学业成绩。他是贝尔实验室的研究员,曾担任 IEEE 学会多媒体服务和终端委员会主席、IEEE 通信委员会区域编辑以及 IEEE 和 联合出版物Transactions on Networking的编辑。

BOB ENSOR 是贝尔实验室/朗讯科技服务基础设施研究部的技术经理。他领导下一代网络架构和组件的研究和开发工作。早些时候,他曾在贝尔实验室的多个项目中担任首席研究员,包括宽带服务数据中心、多媒体消息系统、互联网共享虚拟世界和多媒体会议系统。Ensor 拥有多项专利,并发表了大量论文。他获得了纽约州立大学石溪分校的计算机科学博士学位。

© 2004 1542-7730/04/0600 $5.00

acmqueue

最初发表于 Queue vol. 2, no. 6
数字图书馆 中评论本文





更多相关文章

- 通过语音扩大覆盖范围
BlueNote Networks 产品战略副总裁 Mark Ericson 认为,为了利用新的语音技术,您必须制定一个计划,将该功能直接集成到驱动您现有业务流程的应用程序中。


Gordon Bell - 标准的时间和地点
在未来十年中,我们将遇到至少三个主要机遇,成功将在很大程度上取决于我们定义适当标准的能力。这是因为在恰当的时间出现的精心设计的标准可以通过创建可信赖且可靠的互操作性基础,在很大程度上促进新兴产业并鼓励产品开发。从我的立场来看,我认为特别有希望的三个特定领域是:(1)协同工作的所有电信和计算能力;(2)提供音频和/或视频内容在线分发的混合计算/家庭娱乐产品;以及(3)无线传感器和网络平台(有些人希望 802.15.4 和 ZigBee 联盟标准最终能够实现的那种)。


Douglas C. Sicker, Tom Lookabaugh - VoIP 安全:并非事后诸葛亮
IP 语音 (VoIP) 有望通过打破公共交换电话网络 (PSTN) 的传统单片服务模型,并将控制和配置点从中心办公室交换机更改为最终用户的设备,从而颠覆一个世纪之久的语音电话模型。


James E. Coffman - 不是你父亲的 PBX?
也许没有哪件办公设备比普通的商务电话更被认为是理所当然的了。然而,这种基本通信设备背后的技术正经历着一场重大变革。企业现在正在融合他们的语音和数据网络,以简化他们的网络运营,并利用融合网络交付的新功能优势和能力,从更高的生产力和成本节省到增强的移动性。





© 保留所有权利。

© . All rights reserved.