随着国民经济的高速发展和城市化进程的加快,我国的机动车拥有量及道路交通流量急剧增加。日益增长的交通需求与城市道路基础设施之间的矛盾已成为目前城市交通的主要矛盾,由此导致交通拥挤和堵塞频频发生。交通拥堵严重影响了人们的日常出行活动,制约着城市经济的发展。因此,对交通事件尤其是交通拥堵的识别就显得尤其重要,相关研究工作也得到了一些学者的重视。高丽梅等和杨祖元等将聚类算法应用的交通状态判别中,在一定程度上可以实现交通状态分类。但由于算法没有对缺失数据和错误数据进行处理,会造成聚类中心的偏离,对最终判别结果影响较大。巫威眺等和聂佩林等利用神经网络的自学习和非线性拟合能力对交通状态进行判别,由于训练样本的选取对网络模型训练结果影响较大,导致模型的适用性变差。文献针对交通状态的模糊性,通过建立模糊关系进行交通状态判别,但存在隶属度函数的选择以及规则的枚举等问题。
伴随计算机、通信等技术的发展,交通拥堵自动识别(Automatic Congestion Identification,ACI)技术成为解决交通拥堵问题的新思路。ACI技术的核心功能是利用各种检测设备实时采集交通数据,并依据相关理论与方法快速识别得到交通拥堵发生的时间、地点等信息,从而为交通管理部门提供信息参考。现有交通状态识别技术的数据来源主要包括视频监控、定点线圈检测和浮动车数据采集等。由于视频监控设备的视野范围有限同时工作人员劳动强度大、定点线圈装置的道路覆盖范围较小且线圈容易损坏、GPS浮动车的数量往往不足等诸多问题,导致交通状态判别不够精确。随着相关技术的完善,车牌捕获率与识别率的显著提高,基于车牌识别数据的交通信息采集技术应用而生。相比其他交通信息采集技术,基于车牌识别数据的交通信息采集技术具有工作连续性强、数据精确度高、检测样本量大等优点。姜桂艳等设计了基于车牌识别数据的单车行程速度采集方法和区间平均行程速度采集方法,对交通拥堵识别方法进行了研究。但在进行异常数据处理时,采用的是平均值方法,这对于不同交通时段而言,数据处理误差比较大,难以保证数据处理的准确性。
针对上述交通状态判别方法存在的问题,本文设计了一种基于车牌识别数据的交通状态判别方法,通过异常数据剔除、缺失数据补偿处理保证了数据的准确性。根据样本量和交通时段对旅行时间进行计算,保证了旅行时间计算的合理性。某路段实测数据计算结果,验证了该方法的有效性和实用性。
2 车牌数据采集方法简介
2.1 车牌识别技术定义
车牌识别技术(Vehicle License Plate Recognition,VLPR) 是指能够检测到受监控路面的车辆并自动提取车辆牌照信息(含汉字字符、英文字母、阿拉伯数字及号牌颜色)进行处理的技术。车牌识别是现代智能交通系统中的重要组成部分之一,应用十分广泛。它以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者视频序列进行分析,得到每一辆汽车唯一的车牌号码,从而完成识别过程。
2.2 车牌数据采集规则
安装车牌识别设备于道路的起止点,识读所有通过车辆并记录车牌号码和时间,将数据传送至数据处理系统,计算出车辆的平均旅行时间。其中车牌识别设备包括电子警察、卡口、电子车牌等。
采集车牌种类只限于小型车车牌,不采集摩托车、公交车等车辆的车牌。
采集时间范围为下游路口为当前时间段 (一般设置为5分钟)的过车与上游路口当前时间段 (一般设置为30分钟)的过车。
采集地点范围为上游路口选取的方向与车道以按正常交通习惯进入统计路段为原则,屏蔽在非正常交通习惯下进入路段的车道与路口方向。以正交十字路口为例,采用下列地点的过车数据:
(1)对向道路使用直行车道的过车数据;
(2)左转进入统计路段的上游路口选取道路标线指明左转车道的过车数据;
(3)右转进入统计路段的上游路口如果含有右转灯控,则选取右转车道的过车数据。
下游路口以直行车道为主选取过车数据(有右转灯控的路口可以采用右转车道的过车数据)。在某些特殊路段下,内侧车道因受左转(掉头)信号的控制,往往会产生排队现象,该车道的旅行时间需单独统计,避免对直行车道的采样数据造成干扰。
3 基于车牌识别数据的交通状态判别方法
3.1 车牌信息处理
车牌信息处理的硬件一般包括触发设备(监测车辆是否进入视野)、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机(如计算机)等,软件核心包括车牌定位算法、车牌字符分割算法和光学字符识别算法等。当车辆检测部分检测到车辆到达时触发图像采集单元,采集当前的视频图像。车牌识别单元对图像进行处理,定位出牌照位置,再将牌照中的字符分割出来进行识别,然后组成牌照号码输出。具体处理过程如下:
(1)车牌信息标准化处理
标准化处理主要是为了保证数据格式的一致性和用户信息的保密性,采用多位编码的方式并进行加密处理后再存入数据库中。
(2)车牌信息预处理
区间旅行时间通过车牌识别设备获得单车通过两个断面的时刻,计算公式为:
换算车辆i在该路段的行程速度为:
3.2 异常数据剔除
由于硬件故障、环境变化等因素的影响,车牌数据中常常会出现异常数据。如果把这些数据和正常数据放在一起进行统计,会对计算结果产生不利影响,所以在旅行时间计算前,需要剔除这些异常数据。目前异常数据的判别与剔除主要有物理判别法和统计判别法两种方法。所谓物理判别法就是根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。统计判别法是给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。本文综合这两种方法对异常数据进行判别和剔除。具体过程如下:
正常行驶车辆的速度区间应该符合一般的行程速度区间范围[a km/h, b km/h],把行程速度转换成旅行时间可信区间为[L/b km/h, L/a km/h]。
(1)若旅行时间小于L/ b km/h时,且该类数据在总样本量中占比低于20%时,则视为异常数据予以清除。
(2)若旅行时间大于L/a km/h时,且该类数据在总样本量中占比低于20%时,则视为异常数据予以清除。
通过超限数据剔除,可以比较好的屏蔽掉过大或过小的异常数据,为下面的统计分析提供高质量的基础数据。
3.3 旅行时间统计方案
统计方案考虑交通流的高峰期、平峰期、低峰期三种情况,结合匹配上的车牌数量在经过异常数据剔除后按照大样本量[f5,+∞]、小样本量[f3,f4]、孤立点[f1,f2](f1-f5为样本量阀值)三种情况进行旅行时间计算。在某些特殊场合下要用上下游的过车量、上周期路况状态来辅助统计。
1、大样本量统计方案
据统计旅行时间数据符合正态分布规律,利用3σ准则,对旅行时间数据处理,计算公式为:

排除小概率数据并将过滤后的数据求算术平均值,所得结果作为本周期的旅行时间 T1。统计的样本量中小于旅行时间T1的所有样本数据的平均值作为区间正常行驶的旅行时间。
2、小样本量统计方案
利用3σ准则,对旅行时间数据进行计算,排除小概率数据并将符合3σ的样本数据求算数平均值作为本周期的旅行时间 T1,同时作为推算路况的旅行时间,计算公式同式(1)。
3、孤立点统计方案
(1)高峰时段出现数据量很小,判定为由拥堵造成,只发布路段拥堵状态信息;
(2)平峰时段出现数据量很小,且上周期路况为畅通情况时,采用前周期的数据进行恢复,恢复期限为3周期。第3周期如果还是孤立值时,发布上周同周期历史数据。
(3)低峰时段出现数据量很小,并且上一个周期的路况为畅通情况时,将发布自由流速对应的旅行时间;否则判断为出现交通堵塞造成数据缺失,采用前周期的数据进行恢复,文章来源:中国自动识别网www.cnaidc.com 缺失数据超过3周期后将统计前15分钟的过车数据作为补偿数据。
另外,非低峰时段当检测到上下游过车量为0时,判断为设备异常,发布上周同周期历史数据。低峰时段进行数据恢复,恢复期限为3周期。3周期后采用自由流速度(依据本路段一周的历史数据得出的经验值)对应的路段旅行时间,路段交通拥堵状态为畅通。
3.4 缺失数据补偿
由于种种原因(如施工损坏、线路故障、处理错误等),这些车牌信息数据中存在缺失值现象,对交通流量数据的分析和深层次的数据挖掘带来不利影响,因此需要对这些缺失值进行处理。
非低峰时段当检测到上下游过车量小于5时,判断为设备异常、路口堵塞等情况导致可用样本量较少,此情况判定为数据缺失。对于连续少于三个采样间隔的数据缺失,可以通过前一段时间内的数据进行恢复,具体计算公式为:
历史数据是根据多天数据的平滑值得到的,通过这一方法能够得到任意天的历史数据,它具有变化平稳、波动性小的特点。将其保存下来作为今后数据统计和分析的基础数据,能够很好的描述历史交通状态变化特性。具体计算公式如下:
低峰时段产生缺失数据情况,根据前周期与周边路况判定是流量过低导致小样本的情况,以道路自由流速下对应的旅行时间作为补偿结果。
3.5 交通状况推算
交通拥堵等级判别就是根据当前的交通流特征信息,结合交通知识将交通拥挤程度进行等级划分,以量的形式发布当前的交通拥堵信息。路段的行程速度是表征交通拥挤状态的一个直观、有效的交通流参数。由于交通拥挤的本质是车辆的实际行程速度低于人们期望的行程速度,因此,在能够可靠地获得交通流平均行程速度数据的情况下,通过将其与预订的期望行程速度进行比较,可以实现对道路交通状态的识别。
可以将车辆在某条道路的平均行程速度作为判断该道路拥堵状况的一个参数。已知统计路段本周期旅行时间为T1,换算该路段的平均行程速度为:
根据国内外的实践经验,城市道路交通状态的划分依据主要参数应该是路段的平均行程速度。基于这一考虑,依据城市道路等级及交通状态划分的临界速度值将城市道路交通状态划分为畅通、基本畅通、拥挤、拥堵、堵塞等5个等级,如表1所示。
表1 城市道路交通状态级别划分依据
分 类 等 级 |
A |
B |
C |
D |
E |
|
模糊描述 |
畅通 |
基本畅通 |
拥挤 |
拥堵 |
堵塞 |
|
平均行程速度(km/h) |
快速路 |
>60 |
[40,60] |
[30,40] |
[20,30] |
<20 |
主干路 |
>45 |
[35,45] |
[25,35] |
[15,25] |
<15 |
|
次干路 |
>35 |
[25,35] |
[18,25] |
[12,18] |
<12 |
|
支路 |
>25 |
[18,25] |
[12,18] |
[8,12] |
<8 |
4 实测数据验证
为了验证方法的有效性,本文采用长路段旅行时间计算的准确性对方法进行测试。选取测试的路段位于某市700米长路段,全程封闭没有其他出入口,采集的样本为上游直行和左转进入路段的车辆。
4.1 统计全天过车情况
(1)上游路口一天的过车量均值为 45844辆,其中小型车为15132辆,约占总数的33%。
(2)下游路口一天的过车量均值17415辆,其中小型车为10462辆,约占总数的60%。
(3)全天每5分钟,上游车牌和下游车牌匹配的小型车数量统计结果如图3所示。
(4)全天匹配车辆的旅行时间统计结果如图4所示。
非拥堵情况下,存在部分车辆的旅行时间大于500s,经调查分析原因如下:车辆在下游路口电子警察前掉头,去对面车道下游处加油,然后再调转车头回到下游路口。导致旅行时间比同周期的多出5分钟。实际情况如图5所示:
(5)过车旅行时间和行程速度分布如图6和图7所示:
(1)夜间低峰时段02:00 ~ 03:00
(2)早高峰时段07:00 ~ 09:00
平峰时段,车辆受信号灯的影响,旅行时间的发布明显呈现分两层形态。计算的旅行时间经概率统计后,取中间值发布。
表2 平峰平均平方误差
时 间 段 |
RMSPE |
时 间 段 |
RMSPE |
15:00:00 |
5.66% |
15:35:00 |
9.50% |
15:05:00 |
6.55% |
15:40:00 |
10.61% |
15:10:00 |
13.64% |
15:45:00 |
12.10% |
15:15:00 |
4.30% |
15:50:00 |
14.86% |
15:20:00 |
1.70% |
15:55:00 |
12.29% |
15:25:00 |
11.24% |
16:00:00 |
3.44% |
15:30:00 |
3.67% |
平均 |
8.43% |
(4)晚高峰时段17:00 ~19:00
表3 晚高峰平均平方误差
时间段 |
RMSPE |
时间段 |
RMSPE |
17:00:00 |
5.77% |
18:05:00 |
14.38% |
17:05:00 |
0.39% |
18:10:00 |
9.77% |
17:10:00 |
3.51% |
18:15:00 |
12.28% |
17:15:00 |
1.77% |
18:20:00 |
20.56% |
17:20:00 |
14.03% |
18:25:00 |
11.64% |
17:25:00 |
8.94% |
18:30:00 |
6.51% |
17:30:00 |
5.13% |
18:35:00 |
4.46% |
17:35:00 |
5.23% |
18:40:00 |
5.55% |
17:40:00 |
13.68% |
18:45:00 |
10.11% |
17:45:00 |
10.50% |
18:50:00 |
12.71% |
17:50:00 |
9.13% |
18:55:00 |
17.01% |
17:55:00 |
14.64% |
19:00:00 |
4.22% |
18:00:00 |
17.97% |
平均 |
9.59% |
从方法测试结果可见,旅行时间在各时间段的平均平方误差较小,并且计算结果与实际交通情况相符,表明该方法交通状态判别的有效性。
5 结语
本文设计了一种基于车牌识别数据的旅行时间采集及处理方法对交通状态进行判别。通过异常数据剔除、缺失数据补偿等数据处理和样本量及交通时段的划分,保证了旅行时间计算的准确性和合理性。数据测试结果表明,方法不但可以准确计算出旅行时间和道路状态,同时还可以给出路段的晚低峰、早高峰、平峰时段、夜间低峰的起止时间和平均车速等信息,能够为交通管制提供有效的决策依据。