服務(wù)熱線(xiàn)
歡迎訪(fǎng)問(wèn)西莫羅(北京)智能科技有限公司網(wǎng)站
日期:2017-06-01瀏覽:736次
北京西莫羅閘機一個(gè)動(dòng)態(tài)的場(chǎng)景當中能夠做到的人臉檢測
1:N的部分也會(huì )分為三個(gè)階段,大家zui了解的可能是后面的人臉識別,前面的兩個(gè)階段還是很重要的。
首先,我們要在一個(gè)動(dòng)態(tài)的視頻流當中找到人臉的位置。
然后我門(mén)找到人臉位置以后,還要知道這個(gè)人臉可能有側臉、逆光和模糊的情況出現,所以還會(huì )有一個(gè)判斷的過(guò)程,我這張臉每秒25幀里面哪一幀圖片是適合去做人臉識別的,zui終會(huì )抽取一張比較適合去做人臉識別的照片,zui后再去做人臉識別真正的比對,所以是三個(gè)步驟。
這是給大家展現一個(gè)能力,其實(shí)是在一個(gè)動(dòng)態(tài)的場(chǎng)景當中能夠做到的人臉檢測,也就意味著(zhù)是說(shuō)做*個(gè)步驟,中間你會(huì )看到是有連續性的,如果斷掉有可能會(huì )抓第二次的人臉,抓到兩張照片到底哪張人臉做識別,所以這里面就會(huì )涉及到一個(gè)質(zhì)量判斷。后面的話(huà),其實(shí)給大家也會(huì )做一個(gè)游戲,這個(gè)底下是個(gè)底庫的照片,上面是現場(chǎng)抓拍的照片,我不知道大家用多長(cháng)時(shí)間用7個(gè)人能夠真正的連線(xiàn)起來(lái)。10秒鐘已經(jīng)過(guò)完了,我相信大家基本上10秒還沒(méi)有連完,底下的底庫照片是我們在杭州真正的在逃人員,這里面有*逃犯,下面是現場(chǎng)抓拍到的照片,基本上的話(huà),其實(shí)容貌差別還是可以看到的。通過(guò)人去判斷,*效率和實(shí)效性還是有一定的影響,第二人的判斷多多少少還是有一些差別會(huì )比較大的,也不一定能夠認得出來(lái),比如說(shuō)中間的老太太,差別還是很大的。
所以可以看到用到這種機器的方式和機器視覺(jué)、人臉識別,更多的方式現在還是要提升人員的效率,降本增效的概念。大家比較關(guān)心的是說(shuō)這個(gè)東西到底現在能不能用,或者說(shuō)只是展示了一個(gè)demo還是一個(gè)技術(shù)能力?我們認為我們會(huì )從幾個(gè)點(diǎn)來(lái)分析,到底現在到不到實(shí)用的階段。
首先從技術(shù)上來(lái)看,首先我們在識別的領(lǐng)域當中,現在大家是可以做到萬(wàn)分之十的誤識別的概率,所謂的誤識別識別率是有幾個(gè)定義的,包括識別成功率、誤識、漏識是有概念的,這是業(yè)界通用的幾個(gè)標準。
第二活體驗證。這部分之前2016年有一則新聞,當時(shí)說(shuō)的是趙薇的老公司機套用了他的信息包括他的照片,zui后把他的房子還是車(chē)給賣(mài)了,那個(gè)時(shí)候確實(shí)是做了實(shí)名的比對,但是其中少了一個(gè)環(huán)節是活體驗證,用的是趙薇老公的照片直接做了實(shí)名,所以通過(guò)了整個(gè)的審計環(huán)節和風(fēng)控環(huán)節,所以在活體驗證階段已經(jīng)有比較完善的活體技術(shù),包括像支付寶現在也在用的,為什么他們敢用是有很多的活體技術(shù)促成的,在你們驗證過(guò)程中,有的時(shí)候你會(huì )發(fā)現會(huì )讓你做一些配合性的動(dòng)作,這些動(dòng)作也是為做一個(gè)活體驗證做的資料的準備。
第三,逆光的場(chǎng)景。在我們真正用的時(shí)候,像今天這個(gè)陽(yáng)光就很強烈,真正用的時(shí)候到底能不能用的起來(lái),不像一個(gè)實(shí)驗室,標準上我識別的成功率是在99%或者是幾個(gè)9的概念,真正的逆光的場(chǎng)景下,有可能*就變成零,*是不可用的狀態(tài)。
所以在很多的 角度講,2016年很多公司會(huì )講在這些關(guān)鍵技術(shù)上已經(jīng)有了突破,另外一個(gè)比較好的方式是說(shuō),人臉識別的生物識別技術(shù),其實(shí)是相對于用指紋、虹膜和其他的掌紋來(lái)的會(huì )更加便捷。
*臉是一個(gè)*的標識。比如說(shuō)用指紋識別,有時(shí)候會(huì )有油膩,手指也比較臟,掌紋和虹膜的采集又是比較復雜的過(guò)程,所以從技術(shù)角度講,我們認為它已經(jīng)具備了商業(yè)化的能力。
第二,我們從時(shí)間軸來(lái)看一下。其實(shí)任何一家人臉識別和人工智能的公司都會(huì )經(jīng)歷五個(gè)階段,*階段和第二階段主要是在實(shí)驗室階段,這個(gè)階段其實(shí)大家也比較了解,基本上會(huì )去刷榜,大家會(huì )看到我參加了LFW的一些第三方的公共的公開(kāi)數據,我已經(jīng)變成了世界*,我超過(guò)了 、Facebook,這是刷榜的環(huán)節,大家也知道其實(shí)是有很多的手段的。
第二個(gè)階段會(huì )到我能證明我學(xué)術(shù)的方式能夠做到非常*的水平,我想讓所有人都會(huì )去用,這個(gè)時(shí)候會(huì )產(chǎn)生SDK,給大家去裝。SDK的過(guò)程中和實(shí)驗室算法階段特點(diǎn)都會(huì )比較輕,覆蓋范圍也會(huì )比較目前廣,問(wèn)題就是說(shuō),如果我們做人臉識別只給一個(gè)SDK給到所有的合作伙伴的時(shí)候,合作伙伴真正裝了SDK,到底能不能把他的場(chǎng)景業(yè)務(wù)跑的起來(lái)這件事情,其實(shí)沒(méi)有人知道。比如說(shuō)你在SDK裝進(jìn)去的時(shí)候,會(huì )不會(huì )遇到逆光的場(chǎng)景,會(huì )不會(huì )遇到識別距離的問(wèn)題、會(huì )不會(huì )遇到陰暗面的問(wèn)題,其實(shí)很多的東西是判斷不出來(lái)的。
第三個(gè)階段,由我們來(lái)輸出一些單一的功能性產(chǎn)品或者是單一的功能性解決方案。所以是跟場(chǎng)景結合的,比如說(shuō)跟門(mén)禁結合、考勤結合,跟線(xiàn)上的實(shí)名結合,真正的風(fēng)控可能我們不做,但是實(shí)名的業(yè)務(wù)是一個(gè)單一的功能點(diǎn),這是可以做的,解決一個(gè)真正問(wèn)題的環(huán)節,但是全流程業(yè)務(wù)我們現在覆蓋不了。
第四個(gè)階段,會(huì )是一個(gè)解決方案的層級,在人臉識別或者是人工智能視覺(jué)的領(lǐng)域中會(huì )提供一個(gè)端到端的解決方案,由我們來(lái)替客戶(hù)去想象我前端的硬件設備是什么樣,后端的算法處理器是什么樣,算法是跑在云端還是本地的,是智能化前移還是云計算處理的,這個(gè)時(shí)候更多的合作伙伴應該想象的是他的上層業(yè)務(wù),比如說(shuō)直業(yè)務(wù),所有的快手這些直播平臺,其實(shí)直播應該想到的是怎么維護主播,來(lái)運營(yíng)平臺,來(lái)創(chuàng )造不同的事件,但是直播里面的兔耳朵這些工具,其實(shí)不應該是自己開(kāi)發(fā)的,而且又耗時(shí)耗力。所以這些是不同層級的解決方案。
第五個(gè)階段,就是一個(gè)綜合平臺,因為任何一項技術(shù)都不是的,而且也是單一的功能點(diǎn),所以除了人臉識別之外,有可能還會(huì )結合不同的API的接口調用,有時(shí)候里面會(huì )涉及到指紋、門(mén)禁開(kāi)關(guān),所以會(huì )是一個(gè)綜合性的平臺。
現在任何一家公司基本上都要經(jīng)歷這五個(gè)階段,北京西莫羅是成立比較早,所以時(shí)間窗上相對來(lái)講會(huì )有一定優(yōu)勢,其他家現在是在紅色部分的區域范圍之內。