Нүүр царай таних технологи. Нүүр царайг тусгаарлах, таних. Нүүр царай таних системийг хөгжүүлэхтэй холбоотой гол асуудлууд

19.06.2020

Нээгдсэн шинэ эрин үе. Нүүр царай таних технологи нь түүний гол онцлог юм. Энэхүү түгжээг тайлах аргыг бусад олон ухаалаг гар утсанд хэрэгжүүлнэ гэдэгт хэн ч эргэлзэхгүй байна.

1960-аад онд компьютер хүний ​​нүүр царайг таньж сурах ёстой тусгай туршилтуудыг хийж байжээ. Дараа нь энэ нь юу ч хүргэсэнгүй, учир нь аливаа сэтгэл хөдлөл бүтэлгүйтэлд хүргэсэн. Түүнчлэн зохион бүтээсэн систем нь гэрэлтүүлгийн нөхцлийг өөрчлөхөөс айдаг байв.

Зөвхөн 20-р зууны сүүлчээр л хүмүүсийн царайг гэрэл зургаас таньж, тэдгээрийг санаж сурсан системүүд гарч ирэв. Үүний зэрэгцээ сахал, сахал, нүдний шил болон бусад "хөндлөнгөөс" гарч ирэхэд тэд бүтэлгүйтэхээ больсон. Хамгийн идэвхтэй нь ийм системийг дижитал камерт хэрэгжүүлж эхэлсэн. Тэд аюулгүй байдлын салбарт ч өөртөө байр олсон.

Нүүр царай таних систем нь нэг чухал дутагдалтай байсаар ирсэн. Тэд гэрэлтүүлэг, өнцгөөс ихээхэн хамааралтай байв. Гэсэн хэдий ч аюулгүй байдлын сканнеруудад энэ асуудал анзаарагдсангүй. Нүүрийг нь бараг ойрхон дарж, дараа нь чийдэнгээр гэрэлтүүлэв. Стерео гэрэл зургийг нэвтрүүлэх нь дээр дурдсан сул талыг арилгахад тусалсан. Хоёр камер нь үзэгдлийн гүнийг ойлгодог тул уншилтын нарийвчлал хэд хэдэн удаа нэмэгддэг.

Нүүр царай таних технологи хэрхэн ажилладаг вэ?

Ухаалаг утсанд аажмаар шинэ функц гарч ирэв. Энд зөвшөөрөлгүй хүн төхөөрөмжийн түгжээг тайлж чадахгүй байхын тулд биометрийн хэрэглэгчийн таних үйлдлийг хэрэгжүүлдэг. Зөвхөн ихрүүд л хувийн мэдээлэлд хандах боломжтой. Энэ талаар санаа зовох зүйлгүй. Хэн ч ах, эгчээсээ ямар нэг зүйлийг нухацтай нууна гэдэг юу л бол. Мөн зарим нууц мэдээллийг унших нэмэлт нууц үг оруулахад хэн ч саад болохгүй.

Ухаалаг гар утасны царай таних системийн ажиллагааг дөрвөн үе шатанд хувааж болно.

  1. Нүүр скан хийх.Үүнийг урд талын камер эсвэл iPhone X-ийн нэгэн адил тусгай мэдрэгч ашиглан хийдэг. Скан нь 3D тул зургийн трик ажиллахгүй.
  2. Өвөрмөц өгөгдлийг задлах.Систем нь сканнердсан царайны онцлог шинж чанаруудад анхаарлаа төвлөрүүлдэг. Ихэнхдээ эдгээр нь нүдний нүхний хэлбэр, хацрын ясны хэлбэр, хамрын өргөн юм. Дэвшилтэт системд сорви харагдах болно.
  3. Санах ойноос өмнө нь хүлээн авсан өгөгдөл бүхий загварыг татаж авч байна.
  4. Тоглолт хайх.Систем дэлгэцийн түгжээг тайлах эсэхийг шийдэх эцсийн шат. Орчин үеийн процессоруудын хүч нь танд хэдхэн секундыг "сэтгэхэд" зарцуулах боломжийг олгодог.

Нүүр таних функцийг урд талын камер ашиглан ч хэрэгжүүлэх боломжтой - хоёр линзтэй л бол. Гэхдээ энэ тохиолдолд энэ функцын ажиллагаа тогтворгүй болно. Баримт нь зөвхөн тусгай мэдрэгч нь харанхуйд ч нүүр царайг сканнердах боломжийг олгодог бол урд камер нь тод гэрэлтүүлэг шаарддаг. Түүнчлэн, тусгай мэдрэгч нь нүүрэн дээр илүү олон тооны цэгүүдийг харуулдаг тул сахал, нүдний шил болон бусад саад тотгорууд гарч ирэхэд ч идэвхждэг. Нэг үгээр хэлбэл, зарим DOOGEE Mix 2-д систем нь iPhone X-ээс хамаагүй муу ажиллах нь дамжиггүй. Өөр нэг зүйл бол Apple-ийн ойн бүтээгдэхүүн нь нүүр царай таних функцтэй бусад бүх ухаалаг гар утаснуудаас хамаагүй өндөр үнэтэй байдаг.

Технологи ирээдүй мөн үү?

Нүүр царайг скан хийхэд шаардлагатай мэдрэгч нь төгс суурилуулалтыг шаарддаг. Миллиметрийн 100-ын нэг шилжилт нь функцийн үйл ажиллагаа цаашид тохиромжтой байхаа больсон тул ухаалаг гар утас үйлдвэрлэх явцад согогийн гарц нэмэгдэж, энэ нь түүний өртөг нэмэгдэхэд хүргэдэг. Мэдрэгчид өөрсдөө маш үнэтэй байдаг, гэхдээ тэдэнд патент байхгүй ч зөвхөн Apple үүнийг ашигладаг.

Нэг үгээр хэлэхэд, одоогоор Android үйлдвэрлэгчид нүүрэн талын камер ашиглан нүүр таних функцийг хэрэгжүүлэх болно. Та үүнийг аль хэдийн Samsung Galaxy S8 болон Note 8-аас олж болно. Гэхдээ эдгээр төхөөрөмжүүдийн эзэд энэ нь ажиллахгүй байгааг батлах болно. хамгийн сайн аргаар- хурууны хээ сканнер ашиглахад хялбар. Тиймээс функцийн ирээдүйн талаар юу ч хэлэх боломжгүй байна. Apple нь илүү хямд ухаалаг гар утсанд тохирох мэдрэгчийг нэвтрүүлэх эсэх, мөн тэдгээр нь Android төхөөрөмж дээр гарч ирэх эсэхийг хүлээх хэрэгтэй.

Дүгнэлт

Таны таних мэдээллийг хадгалах талаар санаа зовох шаардлагагүй. Нүүрийг сканнердах үед үүссэн загвар нь тусдаа санах ойн хэсэгт байрладаг - энэ салбарыг компьютер эсвэл гуравдагч талын програмууд унших боломжгүй. Гэхдээ энэ нь хурууны хээнд ч хамаатай. Аль төрлийн таних тэмдгийг ашиглах нь илүү тохиромжтой вэ гэдгийг та өөрөө шийднэ.

Та нүүр царайгаа таньдаг ухаалаг утас барьж байсан уу? Мөн та энэ функцийг бөөнөөр нь хэрэгжүүлэхийг хүлээж байна уу? Сэтгэгдэл дээр санал бодлоо хуваалцаарай, бид үүнд баяртай байх болно!

Байгалийн болон хиймэл орчинд хүний ​​нүүр царайг таних, дараа нь таних нь компьютерийн харааны систем, хиймэл оюун ухааны чиглэлээр ажилладаг судлаачдын нэн тэргүүний зорилт байсаар ирсэн. Гэсэн хэдий ч дэлхийн тэргүүлэх шинжлэх ухааны төвүүдэд хэдэн арван жилийн турш явуулсан олон судалгаа нь хүнийг ямар ч нөхцөлд илрүүлэх, таних чадвартай компьютерийн харааны системийг бий болгоход хүргэсэнгүй. Хурууны хээ эсвэл цахилдаг дүрсээр таних гэх мэт хүний ​​биометрийн таних өөр системийг боловсруулахад ашигласан даалгавар, аргууд нь ижил төстэй хэдий ч нүүрний дүрсээр таних систем нь дээрх системээс хамаагүй доогуур юм.

Компьютерийн харааны системд тулгардаг ноцтой асуудал бол гэрэлтүүлэг, өнгө, масштаб, ажиглалтын өнцгийн өөрчлөлттэй холбоотой харааны зургийн асар их хэлбэлзэл юм. Нэмж дурдахад хүмүүс гудамжаар, байшин дотор хувцастай алхдаг зуршилтай байдаг нь нэг хүний ​​дүр төрхийг ихээхэн өөрчлөхөд хүргэдэг. Гэсэн хэдий ч компьютерийн харааны хамгийн хэцүү асуудал бол 3D бодит ертөнцийн объектуудыг хавтгай дүрс дээр проекцлох үед үүсдэг хоёрдмол утгагүй асуудал юм. Зурган дээрх тус бүрийн пикселийн өнгө, тод байдал нь урьдчилан таамаглахад хэцүү олон тооны хүчин зүйлээс хамаардаг. Эдгээр хүчин зүйлүүд орно:

  1. гэрлийн эх үүсвэрийн тоо, байршил;
  2. цацрагийн өнгө, эрч хүч;
  3. хүрээлэн буй объектуудын сүүдэр эсвэл тусгал.

Зурган дээрх объектуудыг илрүүлэх ажил нь зурагт агуулагдах асар их хэмжээний өгөгдлийн улмаас төвөгтэй байдаг. Зураг нь хэдэн мянган пикселийг агуулж болох бөгөөд тус бүр нь чухал утгатай байж болно. Зурганд агуулагдах мэдээллийг бүрэн ашиглахын тулд объектын боломжит хэлбэлзлийг харгалзан пиксел тус бүрийг объект эсвэл дэвсгэрт хамаарах эсэхийг тодорхойлохын тулд дүн шинжилгээ хийх шаардлагатай. Ийм дүн шинжилгээ нь шаардлагатай санах ой болон компьютерийн гүйцэтгэлд өндөр зардал шаардаж болно.

Энэ асуудлын шийдэл нь үүнд оршдог зөв сонголт хийхсистем бий болсон илрүүлэх, таних объектуудын тодорхойлолт. Объектыг дүрслэхдээ түүний хамгийн онцлог шинж чанарыг харгалзан үзэх ёстой бөгөөд энэ объектыг хүрээлэн буй үзэгдлийн бусад элементүүдээс ялгах хангалттай төлөөлөл байх ёстой. Хүссэн тайлбарыг сонгохдоо субьектив байдлаас зайлсхийхийн тулд генетикийн алгоритмууд болон хиймэл мэдрэлийн сүлжээг сургахдаа объектын тохирох шинж чанарыг автоматаар сонгох аргыг ашиглаж болно. Үүний зэрэгцээ, объектын тайлбарт хэд хэдэн параметр байдаг бөгөөд одоогоор илрүүлэх, таних системийг боловсруулж буй судлаач сонгох ёстой. Эдгээр сонголтууд нь:

  1. үзэгдэл ба объектын 2 хэмжээст ба 3 хэмжээст дүрслэлийн хоорондох сонголт. 2D дүрслэлийг ашигладаг алгоритмууд нь ихэвчлэн 3D алгоритмуудаас хялбар байдаг боловч үүнтэй зэрэгцэн үзэхийн янз бүрийн нөхцөлд объектын дүрслэлд тохирсон олон тооны янз бүрийн тайлбарыг шаарддаг;
  2. объектыг бүхэлд нь эсвэл олон тооны харилцан уялдаатай элементүүдээс бүрдсэн систем болгон дүрслэх сонголт;
  3. объектын онцлогийг тодорхойлсон геометрийн болон бусад шинж чанарт суурилсан шинж чанаруудын системийн хоорондох сонголт.

Хамгийн ерөнхий тохиолдолд хүнийг царайных нь дүр төрхөөс илрүүлэх, таних асуудлыг шийдэх алгоритм нь дараах тодорхой алхамуудаас бүрдэнэ.

  1. дүн шинжилгээ хийсэн үзэгдэлд хүн байгаа эсэхийг илрүүлэх;
  2. хүний ​​дүр төрхийг тодруулах;
  3. толгойн сонголт;
  4. толгойн харагдах өнцгийг тодорхойлох (бүтэн нүүр, профиль);
  5. нүүрний сонголт;
  6. стандарттай харьцуулах, тодорхойлох.

Тодорхой нөхцлөөс хамааран алгоритмын бие даасан алхамуудын бүтэц, хэрэгжилт өөр өөр байж болно. Хамгийн хэцүү тохиолдолд, маш их өөрчлөгдөж буй орчинд, их хэмжээний мэдээллийн урсгалтай (хөдөлгөөн ихтэй хотын гудамж, метро, ​​нисэх онгоцны буудал, гэх мэт), алгоритмын сэтгэл ханамжтай үр дүнд хүрэхийн тулд хамгийн их боломжтой мэдээллийг ашиглах шаардлагатай. Алгоритм нь үзэгдлийн хөдөлгөөнгүй, аажмаар өөрчлөгдөж буй элементүүдийг үр дүнтэй таслах, гэрэлтүүлгийн янз бүрийн нөхцөлд ажиллах, хүний ​​дүр төрхийг өөр өөр өнцгөөс тодорхойлох, олон хүмүүсийн хөдөлгөөнийг хянах, тухайн хүнийг танихад тохиромжтой мөчийг автоматаар сонгох чадвартай байх ёстой ( жишээ нь, хангалттай нарийвчлалтай нүүрний урд талын зургийг авах боломжтой үед). Алгоритмын ийм чадавхийг хангахын тулд олон камерын хяналт, дүр зурагт дүн шинжилгээ хийх, үзэгдлийн 3D бүтцийг тодруулах чадвартай, видео урсгалыг өндөр хурдтай шүүлтүүрээр оруулах зэрэг системийн тодорхой техник хангамж шаардлагатай. үзэгдэлийн элементүүдийг хөдөлгөөний параметрээр, мөн үзэгдлийн элементүүдийг тодруулахын тулд өнгө ашиглах. Нэмж дурдахад, өндөр нарийвчлалтай, сайн оптик бүхий камерууд найдвартай таних боломжийг хангахын тулд шаардлагатай. Илүү энгийн тохиолдолд, хөдөлгөөнгүй үзэгдэл, үйл явдлын хязгаарлагдмал урсгалтай (хүмүүсийн дүр төрх) илүү энгийн техник хангамжийн бүтэц, алгоритмыг ашиглах боломжтой, жишээлбэл, стерео хос эсвэл нэг камер, урьдчилан бэлтгэсэн дүр зурагны загвар байж болно. Энэ нь тухайн хүн хяналтын бүсэд байгаа эсэхийг найдвартай тодорхойлоход хангалттай бөгөөд түүний дүр төрхийг тодруулж, түүнийг таних болно. Тайзан дээр хүн байгаа эсэхийг тодорхойлох ажил нь алгоритмаас тодорхой түвшний оюун ухаан шаарддаг. Энэ нь дүр зураг өөрчлөгдөхөд зүгээр л хариу үйлдэл үзүүлдэг систем байж болохгүй. Гэрэлтүүлгийн өөрчлөлт, хөдөлгөөнгүй объектоос сүүдэр шилжих, хяналтын бүсэд амьтад харагдах гэх мэт тохиолдолд хүнийг илрүүлэх алгоритм нь хуурамч дохиолол өгөх ёсгүй. Шаардлагатай үед үзэгдлийн зохих тайлбарыг бий болгох асуудал үүсдэг. . Энэхүү тайлбар нь үзэгдлийн гурван хэмжээст загвар, үзэгдлийн элементүүдийн өнгө, тод байдлын тархалтын магадлалын загвар эсвэл үзэгдлийн элементүүдийг таних объектоос (манай тохиолдолд хүний ​​дүрс) ялгах шинж чанаруудын системийг илэрхийлж болно. Суурь эсвэл урд талын элементүүд гэж тооцогддог үзэгдлийн элементүүдийн хоорондын хамаарал өөрчлөгдөж болно. Хүний ижил дүрс, хэрэв түүний дүрс нь оптик системийн нарийвчлалаар тодорхойлогддог тодорхой босго хэмжээнээс бага байвал түүний дүн шинжилгээ нь үндсэн ажил болох хүнийг тодорхойлоход үр дүнгүй тул суурь элемент гэж ангилж болно.

Нүүрнийх нь дүр төрхөөс хүнийг тодорхойлох алгоритмын сонголт нь түүнийг хэрэглэх тодорхой нөхцлөөс хамаарна. Жишээлбэл, олон давхаргат мэдрэлийн сүлжээ нь хязгаарлагдмал бүлэгт таних даалгаврыг амархан даван туулж чадна. Үүний зэрэгцээ, олны дунд (тодорхойгүй найрлагатай) тодорхой хүнийг илрүүлэх ажил нь хуурамч дохиоллын түвшинг бууруулах нарийн төвөгтэй аргыг ашиглахыг шаарддаг. Энэ тохиолдолд санал хураах аргыг ашиглан шийдвэр гаргахдаа янз бүрийн функциональ орон зайд ажилладаг олон анализаторуудыг агуулсан олон түвшний систем шаардлагатай болно. Ажлын эхний үе шатанд таних систем нь тохиромжгүй нэр дэвшигчдийг таслан зогсоож, үлдсэн нэр дэвшигчдийг тодорхойлох эцсийн шийдвэрийг гаргахад ашиглах ёстой.

Доорх нь нүүрний дүр төрхөөс хүнийг илрүүлэх, таних аргуудын тоймыг доор харуулав. Энэхүү тоймд зөвхөн зохиогчдын үзэж байгаагаар байгалийн нөхцөлд хүнийг нүүрний зурагнаас илрүүлэх орчин үеийн алгоритмд хамгийн өргөн хэрэглэгддэг аргуудыг багтаасан болно.

Зургийг таних олон янзын алгоритм, аргуудын тусламжтайгаар таних ердийн арга нь гурван үндсэн бүрэлдэхүүн хэсгээс бүрдэнэ.

  1. анхны дүрсийг стандарт дүрслэл болгон хувиргах;
  2. гол шинж чанаруудыг тодруулах;
  3. ангилал (загварчлах) механизм: кластер загвар, метр, мэдрэлийн сүлжээ гэх мэт.

Нэмж дурдахад, таних аргыг бий болгох нь тухайн сэдвийн талаархи априори мэдээлэлд (энэ тохиолдолд хүний ​​​​нүүрний шинж чанар) суурилсан бөгөөд аргыг боловсруулах явцад гарч ирсэн туршилтын мэдээллээр тохируулагддаг.

Үндсэн бүрэлдэхүүн хэсгийн арга.

Үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ (PCA) аргыг мэдээллийн агуулгыг мэдэгдэхүйц алдагдуулахгүйгээр шахахад ашигладаг. Энэ нь $N$ хэмжээст $\textbf(x)$ оролтын векторыг $M$, $N>M$ хэмжээст $\textbf(y)$ гаралтын вектор болгон шугаман ортогональ хувиргалтаас бүрдэнэ. Энэ тохиолдолд $\textbf(y)$ векторын бүрэлдэхүүн хэсгүүд харилцан хамааралгүй тул хувиргасны дараах нийт дисперс өөрчлөгдөхгүй хэвээр байна. $\textbf(X)$ матриц нь сургалтын багцын бүх жишээ зургуудаас бүрдэнэ. $\boldsymbol\Lambda = \boldsymbol(\Phi)^T \boldsymbol(\Sigma)\boldsymbol(\Phi)$ тэгшитгэлийг шийдсэний дараа бид $\boldsymbol(\Phi)$ хувийн векторуудын матрицыг олж авах бөгөөд энд $\ boldsymbol(\Sigma )$ нь $\textbf(x)$-ын ковариацын матриц, $\boldsymbol(\Lambda)$ нь хувийн утгуудын диагональ матриц юм. $\boldsymbol(\Phi)$ дотроос $\boldsymbol(\Phi)_M$ дэд матрицыг $M$-н хамгийн том хувийн утгад харгалзах замаар сонгосноор $\textbf(y) = \boldsymbol(\Psi)_M^ хувиргах болно. T \ widetilde(\textbf(x))$, энд $\widetilde(\textbf(x)) = \textbf(x) - \overline(\textbf(x))$ нь математикийн тэг хүлээлттэй нормчлогдсон вектор бөгөөд тодорхойлогддог. нийт дисперсийн ихэнх нь бөгөөд $\textbf(x)$-н хамгийн чухал өөрчлөлтүүдийг тусгадаг. Эхний $M$ үндсэн бүрэлдэхүүн хэсгүүдийг сонгох нь вектор орон зайг үндсэн бүрэлдэхүүн хэсгүүдийг агуулсан $F = \left\(\boldsymbol(\Phi)_i\right\)_(i=1)^M$ үндсэн (өөрийн) орон зайд хуваана. , ба түүний ортогональ нэмэлт $F = \left\(\boldsymbol(\Phi)_i\right\)_(i=M+1)^(N)$. Үндсэн бүрэлдэхүүн хэсгийн аргын гишүүнчлэлийн үзүүлэлт болгон дараахь зүйлийг ашигладаг.

DIFS - онцлог орон зай дахь зай, өөрийн орон зайд дүн шинжилгээ хийсэн зургийн дүрсээс лавлагаа зураг хүртэлх зай;

DFFS - шинж чанараас зай, ажиглалтын орон зайд дүн шинжилгээ хийсэн зургийг дүрслэхээс өөрийн орон зай дахь стандартын проекц хүртэлх зай.

Өвөрмөц вектор зургийн жишээ (худалдаа)

Нүүрний зургаас хүнийг таних даалгавар нь дараах хэлбэртэй байна. Оролтын векторууд нь нүүрний төвлөрсөн болон масштабтай зургууд юм. Нүүрний зургийн бүх багцад тооцсон хувийн векторуудыг хувийн нүүр гэж нэрлэдэг. Нүүрний зураг дээр хэрэглэх үндсэн бүрэлдэхүүн хэсгүүдийн аргыг мөн хувийн нүүрний арга гэж нэрлэдэг (Зураг 1). Өмнө нь тооцоолсон матрицуудыг ашиглан оролтын зургийг үндсэн бүрэлдэхүүн хэсэг гэж нэрлэдэг шугаман коэффициентүүдийн багц болгон задалдаг. Эхний үндсэн бүрэлдэхүүн хэсгүүдийн $N$-ийн нийлбэрийг харгалзах хувийн векторуудаар үржүүлсэн нь $N$ захиалгын дүрсний ойролцоо утгатай байна (Зураг 2).

Нүүрний хэвийн дүр төрх ($\textit(a)$) ба 85$ үндсэн бүрэлдэхүүн хэсгүүдийг ($\textit(b)$) ашиглан сэргээн засварласан.

Нүүрний дүрс бүрийн хувьд түүний үндсэн бүрэлдэхүүн хэсгүүдийг тооцдог. Ерөнхийдөө үндсэн бүрэлдэхүүн хэсгүүд нь $ 5-аас $ 200 хооронд хэлбэлздэг. Үлдсэн бүрэлдэхүүн хэсгүүд нь нүүр царай болон дуу чимээний хоорондох жижиг ялгааг кодчилдог. Таних үйл явц нь үл мэдэгдэх зургийн үндсэн бүрэлдэхүүн хэсгүүдийг бусад бүх зургийн бүрэлдэхүүн хэсгүүдтэй харьцуулахаас бүрдэнэ. Энэ зорилгоор зарим төрлийн хэмжигдэхүүнийг ихэвчлэн ашигладаг (хамгийн энгийн тохиолдол бол Евклидийн зай юм). Нүд, хамар, ам зэрэг нүүрний тусдаа хэсэгт үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээг нэмэлтээр хэрэглэснээр найдвартай байдлын нэмэлт өсөлтөд хүрдэг.

Үндсэн бүрэлдэхүүн хэсгийн аргыг мөн зураг дээрх нүүр царайг илрүүлэхэд ашигладаг. Нүүрний хувьд тохирох орон зай дахь бүрэлдэхүүн хэсгүүдийн утга нь том бөгөөд зохих орон зайг нөхөхөд тэдгээр нь тэгтэй ойролцоо байна. Энэ баримтаар оролтын дүрс нь нүүр мөн эсэхийг илрүүлж болно. Үүнийг хийхийн тулд сэргээн босголтын алдааны хэмжээг шалгана; алдаа их байх тусам нүүр царай биш байх магадлалтай. Арьс өнгө, хүйс, сэтгэл хөдлөл, гэрэлтүүлэг гэх мэт нүүрний зургийн багцад өөрчлөлт гарсан тохиолдолд бүрэлдэхүүн хэсгүүд гарч ирэх бөгөөд тэдгээрийн хэмжээ нь эдгээр хүчин зүйлээр тодорхойлогддог. Тиймээс харгалзах үндсэн бүрэлдэхүүн хэсгүүдийн утгууд дээр үндэслэн, жишээлбэл, тухайн хүний ​​арьс өнгө, хүйсийг тодорхойлох боломжтой. PCA-ийн гол сул талууд нь дараах байдалтай байна. Eigenface арга нь гэрэлтүүлгийн жигд параметрүүд, төвийг сахисан нүүрний хувирал, нүдний шил, сахал зэрэг хөндлөнгийн оролцоогүй байх зэрэг оновчтой нөхцлийг шаарддаг. Хэрэв эдгээр нөхцөл хангагдаагүй бол үндсэн бүрэлдэхүүн хэсгүүд нь анги хоорондын өөрчлөлтийг тусгахгүй. Жишээлбэл, гэрэлтүүлгийн өөр өөр нөхцөлд, анхны үндсэн бүрэлдэхүүн хэсгүүд нь гэрэлтүүлгийн өөрчлөлтийг голчлон тусгадаг тул харьцуулалт нь ижил төстэй гэрэлтүүлгийн түвшинтэй зургийг гаргадаг тул хувийн нүүр царайг ашиглах боломжгүй юм.

Өвөрмөц векторуудын багцыг тооцоолох нь маш их хөдөлмөр шаарддаг. Нэг арга бол зургуудыг мөр, багананд нэгтгэх явдал юм; Энэ хэлбэрээр дүрслэл нь жижиг хэмжээтэй, тооцоолол, таних нь илүү хурдан байдаг боловч анхны зургийг сэргээх боломжгүй болсон.

Шугаман дискриминант анализ.

Шугаман ялгаварлан гадуурхах шинжилгээ (LDA) нь зургийн орон зайн проекцийг функцийн орон зайд ашигладаг бөгөөд энэ нь анги доторх зайг багасгаж, анги хоорондын зайг хамгийн их байлгах боломжийг олгодог. Эдгээр аргууд нь ангиудыг шугаман байдлаар салгах боломжтой гэж үздэг.

Зургийн орон зайг онцлог орон зайд проекцлох $\textbf(W)$ матрицыг дараах нөхцлөөс сонгоно: $$ \textbf(W)_(\textrm(opt))= \textrm(arg) \max_\textbf (W) \frac (\textbf(W)^T \textbf(S)_\textbf(B) \textbf(W))(\textbf(W)^T \textbf(S)_\textbf(W) \ textbf(W)) , $$ Энд $\textbf(S)_(\textbf(B))$ нь анги хоорондын дисперсийн матриц, $\textbf(S)_(\textbf(W))$ нь анги доторх дисперсийн матриц юм. .

Онцлогын орон зайн суурь болох $c-1$ хүртэлх векторууд байж болох ба $c$ нь ангиудын нийт тоо юм. Эдгээр векторуудыг ашиглан зургийн орон зайг онцлог орон зай болгон хувиргадаг.

$\textbf(S)_\textbf(W) \in (R)^(n\times n) $ матрицтай шууд ажиллах нь хэмжээсийнхээ улмаас хүндрэлтэй байдаг тул үндсэн бүрэлдэхүүн хэсгийн аргыг ашиглан хэмжээсийн урьдчилсан бууралтыг ашигладаг. Дараа нь тооцооллыг бага хэмжээтэй орон зайд гаргадаг: $$ \textbf(W)_\textrm(fld)=\textrm(arg) \max_\textbf(W) \frac(\textbf(W)^T \textbf( W)_(\ textrm(pca))^T \textbf(S)_\textbf(B) \textbf(W)_(\textrm(pca)) \textbf(W))(\textbf(W)^T \textbf(W) _(\textrm(pca))^T \textbf(S)_\textbf(W) \textbf(W)_(\textrm(pca)) \textbf(W)), $$ энд $ \textbf(W) _(\textrm(pca))$ нь бага хэмжээст орон зайд (үндсэн бүрэлдэхүүн хэсгүүдийн орон зай) проекц хийх матриц юм.

Дүрмээр бол сургалтын багц нь гэрэлтүүлгийн хэд хэдэн үндсэн нөхцөлд байгаа царайны зургийг агуулдаг бөгөөд тэдгээрээс шугаман хослолыг ашиглан бусад гэрэлтүүлгийн нөхцлийг олж авах боломжтой. Энэ арга нь өргөн хүрээний гэрэлтүүлгийн нөхцөл, нүүрний янз бүрийн илэрхийлэл, нүдний шил байгаа эсэх зэргийг таних өндөр нарийвчлалыг (ойролцоогоор 96(\%)) өгдөг. Гэсэн хэдий ч, энэ аргыг том мэдээллийн сангаас хайхад ашиглах боломжтой эсэх, зарим нүүрэнд зориулсан сургалтын багц нь зөвхөн нэг гэрэлтүүлгийн нөхцөлд зураг агуулсан тохиолдолд энэ арга ажиллах боломжтой эсэх зэрэг асуултууд хэвээр байна. LDA ашиглан нүүр царайг илрүүлэх даалгаврын хувьд нүүр царай болон нүүр царайгүй ангиудыг дэд ангилалд хуваадаг. Дээрх арга нь зургийн орон зай дахь ангиудыг шугаман салгах боломжтой гэсэн таамаглал дээр суурилдаг. Ерөнхийдөө энэ таамаг буруу байна. Мэдрэлийн сүлжээний аргууд нь нарийн төвөгтэй хуваах гадаргууг бүтээх хэрэгслийг санал болгодог.

Шугаман ангиллын объектуудын синтез.

Энэ арга нь объектын шинэ зургийг (ялангуяа нүүрний дүрсийг) өөр өөр өнцгөөр нэгтгэх боломжийг олгодог. Сургалтын багц нүүр царай, тодорхой өнцгөөс шинэ объектын зөвхөн нэг дүрс байдаг. Сургалтын иж бүрдэл нь шинэ объекттой ижил ангиллын объектуудын (энэ тохиолдолд нүүрний ангилал) зургуудаас бүрдэх бөгөөд янз бүрийн царайны зургуудыг багтаасан бөгөөд нүүр болгонд түүний өргөн өнцгөөс авсан зургууд байдаг. $A$ хэтийн төлөвт $X^(A)$ дүрс бүхий шинэ объектын хувьд шугаман задралыг $\alpha_i коэффициентийн тооцоогоор сургалтын багцаас ижил хэтийн төлөвт байгаа объектуудын зураг болгон хувиргадаг. : X^A = \sum_(i=1 )^(q)\alpha_i X_i^A , $ Энд $q$ нь сургалтын багц дахь объектын тоо юм. $X^(B)$ дүрсийг шинэ объектод $B$ шинэ хэтийн төлөвт нэгтгэх нь $B$ хэтийн төлөв дэх сургалтын багцаас ижил коэффициент бүхий зургуудыг нэмэх замаар хийгддэг: $X^B = \sum_(i). =1)^(q) \alpha_i X_i^B $. Тиймээс энэ арга нь гурван хэмжээст нарийн төвөгтэй загвар ашиглахгүйгээр шинэ объектын зургийг нэг өнцгөөс өөр өөр өнцгөөс нэгтгэх боломжийг олгодог. Энэхүү арга нь гурван хэмжээст нарийн төвөгтэй загвар ашиглахгүйгээр шинэ өнцгөөс зургийг нэгтгэх ирээдүйтэй боловч сургалтын багц дахь жишээнүүдийн чанар, тоон тухай асуудал нээлттэй хэвээр байна.

Уян хатан хэлбэрийн нүүрний загварууд.

Эдгээр аргуудын хувьд таних нь нүүрний хэлбэрийг харьцуулах үндсэн дээр хийгддэг. Контурыг ихэвчлэн толгой, чих, уруул, хамар, хөмсөг, нүдний зураасаар зурдаг. Контурыг гол байрлалаар төлөөлдөг бөгөөд тэдгээрийн хооронд контурт хамаарах цэгүүдийн байрлалыг интерполяцаар тооцдог. Контурыг нутагшуулахын тулд янз бүрийн аргаСургалтын багцад дүн шинжилгээ хийсний үр дүнд олж авсан урьдчилсан мэдээлэл болон мэдээллийг хоёуланг нь ашигладаг. Ихэвчлэн сургалтын зургийн багц дээр гол цэгүүдийг гараар байрлуулдаг. Шинэ нүүрний хэлбэрийг хайж олохдоо хоёр бүрэлдэхүүн хэсгийн объектив функц бүхий дуурайлган зөөлрүүлэх аргыг ашигладаг. Тэдгээрийн эхнийх нь контурт перпендикуляр шугам дээр гаргаж авсан пикселийн эрч хүч нь сургалтын багцын пикселтэй ижил төстэй байх үед, контур нь контурын хэлбэртэй давхцах үед хамгийн дээд хэмжээг эрэлхийлдэг сургалтын жишээнүүдээс. Ийм байдлаар нүүрний онцлогийг тоймлон гаргаж авдаг. Зургийг харьцуулахын тулд гол цэгүүдийн координатыг харуулсан векторын багц дээр тооцоолсон үндсэн бүрэлдэхүүн хэсгүүдийн утгыг ашигладаг. Контурыг таних гол ажил бол эдгээр контурыг зөв сонгох явдал юм. Ерөнхийдөө энэ ажлыг нарийн төвөгтэй байдлын хувьд дүрсийг танихтай харьцуулж болно.

Уян харимхай графикуудын харьцуулалт.

Энэ аргын хувьд (Elastic Bunch Graph Matching) нүүрийг график хэлбэрээр дүрсэлсэн бөгөөд оройнууд нь толгой, уруул, хамрын контур, тэдгээрийн ирмэг зэрэг нүүрний гол цэгүүдэд байрладаг. Нүүр бүрийг оройн хоорондох зайгаар тэмдэглэсэн байдаг. Ийм цэг бүрт Габорын функцүүдийн тэлэлтийн коэффициентийг таван өөр давтамж, найман чиг баримжаагаар тооцдог. Ийм коэффициентуудын багц $\textbf(J) = \(J_j\)$ нь $\textit(jet)$ (jet) гэж нэрлэгддэг. Тийрэлтэт онгоцууд нь зургийн орон нутгийн бүс нутгийг тодорхойлдог бөгөөд хоёр зорилгод үйлчилдэг: нэгдүгээрт, хоёр өөр зураг дээр тухайн бүс дэх захидал харилцааны цэгүүдийг олох; хоёрдугаарт, өөр өөр зургийн харгалзах хоёр хэсгийг харьцуулах. Янз бүрийн зургийн нэг талбайн цэгүүдийн $J_j = a_j \exp (i \phi_j)$ коэффициент бүр нь цэгийн байрлалаас хамааран аажмаар өөрчлөгддөг $a_j$ далайц, $\phi_j$ үе шатаар тодорхойлогддог. , долгионы суурь функцийн векторын давтамжтай пропорциональ хурдтай эргэлддэг. Тиймээс, хамгийн энгийн тохиолдолд шинэ зураг дээрх ижил төстэй шинж чанартай цэгүүдийг хайхын тулд ижил төстэй байдлын функцэд үе шатыг тооцдоггүй: $$ S_a(\textbf(J), \textbf(J)") = \ frac(\sum_j a_ja_j^(\prime)) (\sqrt(\sum_j a_j^2 \sum_j a_j^(\prime 2))) .$$ Нэг тийрэлтэт тогтмол байрлалтай, нөгөө нь хувьсах байрлалтай ижил төстэй байдлын функц Энэ нь тархалт эсвэл градиент буурах зэрэг энгийн аргуудыг ашиглан хайлт хийхэд хангалттай жигд байна Түүний дүрсийн нэг ба ижил график дахь өөрчлөлтүүд, тус бүр нь тухайн цэгийн өөр өөр шинж чанаруудтай тохирч болох хэд хэдэн тийрэлтэт онгоцыг ашигладаг, жишээлбэл, нээлттэй, хаалттай нүдийг таних үйл явц $$ S_B (G^I , B)= \frac(1)(N) \sum_n \max_m S_-ийн $G^I$-ийн нүүрний зургийн графикийг $B$ багцын бусад бүх графиктай харьцуулахаас бүрдэнэ. (\phi)(J_n^I , J_n^(Bm))- \frac (\lambda)(E)\sum_e \frac((\Delta \textbf(x)_e^I - \Delta \textbf(x)_e) ^B)^2)((\Дельта \textbf(x)_e^B )^2). $$

Зүүн нийлбэр нь фазын мэдрэмтгий функцийг ашиглан тооцоолсон тийрэлтэт онгоцны ижил төстэй байдлыг тодорхойлдог бөгөөд баруун нийлбэр нь харьцуулсан зургийн харгалзах оройнуудын хоорондох зайны зөрүүний квадраттай пропорциональ байр зүйн захидал харилцаа юм, $ N $ оройн тоо, $E$ нь нүүрний тоо, $\lambda$ нь байр зүйн мэдээллийн харьцангуй ач холбогдлын коэффициент юм.

Дээр үзүүлсэн хэлбэрээр энэ арга нь $20$° хүртэлх өнцгийн өөрчлөлтийг найдвартай таних чадвартай; том өнцгөөр таних нарийвчлал огцом буурч, ижил төстэй байдлын функц нь анги хоорондын ялгаанаас илүү өнцөгт мэдрэмтгий болж хувирдаг. Аргын цаашдын хөгжил нь сургалтын багцад дүн шинжилгээ хийсний үндсэн дээр ач холбогдлын коэффициентийг гаргаж авах явдал юм. Тийрэлтэт бүрийн хувьд ач холбогдлын коэффициентийг симплекс аргыг ашиглан тооцоолж, дараа нь ижил төстэй байдлын функцэд ашигладаг. Ач холбогдолын коэффициентийг нэг хүний ​​хувьд ижил төстэй функцийг нэмэгдүүлэх, өөр өөр хүмүүст хамгийн бага байлгах нөхцлөөр тооцдог. Мөн анх тодорхойлсон гол цэгүүд болон график бүтцийг ашигладаггүй энэ аргын өмнөх хувилбарууд байдаг. Тэдгээрийн зарим нь харьцуулахын тулд зураг дээр байрлуулсан тийрэлтэт торыг ашигладаг. 3. Үл мэдэгдэх дүрс дээр харьцах цэгүүдийг олж, дараа нь олсон цэгүүдээс гажсан торыг барьж, түүний гажуудлын зэргийг хэмжиж, хамгийн төстэй дүрсийг тодорхойлно. Бусад аргуудын хувьд тийрэлтэт олборлох цэгүүд нь эхлээд тор үүсгэдэг бөгөөд дараа нь сургалтын явцад танихад хамгийн бага тохиромжтой цэгүүдийг арилгадаг.

Зураг болон түүний гажуудсан хувилбар дээр давхарласан уян харимхай сүлжээ

Нүүрний геометрийн шинж чанарт суурилсан аргууд.

Хамгийн анхны аргуудын нэг бол нүүрний геометрийн шинж чанарыг шинжлэх явдал юм. Эхэндээ үүнийг шүүх эмнэлгийн шинжлэх ухаанд ашиглаж байсан бөгөөд тэнд нарийвчлан боловсруулсан. Дараа нь энэ аргын компьютерийн хэрэгжилт гарч ирэв. Үүний мөн чанар нь нүүрний гол цэгүүдийн багцыг (эсвэл хэсэг) сонгож, дараа нь онцлог шинж чанаруудыг сонгох явдал юм. Онцлог бүр нь гол цэгүүдийн хоорондох зай эсвэл ийм зайны харьцаа юм. Графикийг уян харимхай харьцуулах аргаас ялгаатай нь энд зайг график нум болгон сонгохгүй. Хамгийн их мэдээлэл өгөх шинж чанаруудын багцыг туршилтаар тодорхойлдог.

Гол цэгүүд нь нүдний булан, уруул, хамрын үзүүр, нүдний төв гэх мэт байж болно. Зураг. 4. Тэгш өнцөгт хэсгүүд нь гол хэсгүүдийн үүрэг гүйцэтгэдэг, үүнд: нүд, хамар, ам.

Таних явцад үл мэдэгдэх царайны шинж чанаруудыг мэдээллийн санд хадгалагдсан шинж чанаруудтай харьцуулдаг. Гол цэгүүдийг олох ажил нь таних нарийн төвөгтэй байдалд ойртдог бөгөөд зураг дээрх гол цэгүүдийг зөв олох нь таних амжилтыг ихээхэн тодорхойлдог. Тиймээс хүний ​​нүүрний дүр төрх нь гол цэгүүдийг хайх үйл явцад саад учруулдаг хөндлөнгийн оролцоогүй байх ёстой. Ийм хөндлөнгийн оролцоо нь нүдний шил, сахал, гоёл чимэглэл, үс засалт, будалт зэрэг орно. Гэрэлтүүлэг нь бүх зураг дээр жигд, ижил байх ёстой. Үүнээс гадна нүүрний дүрс нь урд талын өнцөгтэй байх ёстой бөгөөд магадгүй бага зэрэг хазайлттай байх ёстой. Нүүрний илэрхийлэл нь төвийг сахисан байх ёстой. Энэ нь ихэнх аргуудад ийм өөрчлөлтийг бүртгэх загвар байдаггүйтэй холбоотой юм.

Тиймээс энэ арга нь буудлагын нөхцөлд нэлээд хатуу шаардлага тавьдаг бөгөөд ерөнхий хэргийн гол цэгүүдийг олох найдвартай механизмыг шаарддаг. Үүнээс гадна өөрчлөлтийн загварыг ангилах эсвэл бүтээх илүү дэвшилтэт аргууд шаардлагатай. Ерөнхийдөө энэ арга нь хамгийн оновчтой биш боловч зарим тодорхой ажлуудын хувьд энэ нь ирээдүйтэй хэвээр байна. Ийм даалгаварт тухайн үед хүлээн авсан хүний ​​дүр төрхийг баримт бичигт байгаа гэрэл зурагтай харьцуулах шаардлагатай бол баримт бичгийн хяналт орно. Гэсэн хэдий ч энэ хүний ​​өөр зураг байхгүй тул сургалтын багцад дүн шинжилгээ хийсэн ангиллын механизм байхгүй байна.

Таних цэг ба зай: $\textit(a)$ - шүүх эмнэлгийн шинжилгээнд ашигладаг; $\textit(b)$ - автоматжуулсан таних системийг барихад ихэвчлэн ашиглагддаг

Загваруудын харьцуулалт.

Загвар тохирох нь Зураг дээр үзүүлсэн зургийн нүүрний хэсгийг сонгох явдал юм. 5, дараа нь эдгээр хэсгүүдийг хоёр өөр зурагтай харьцуулна. Тохирсон бүс бүр нь зургийн ижил төстэй байдлын хэмжүүрийг нэмэгдүүлдэг. Энэ нь хүнийг нүүрний дүр төрхөөр таних түүхэн анхны аргуудын нэг юм. Талбайг харьцуулахын тулд пикселээр пикселийн харьцуулалт гэх мэт энгийн алгоритмуудыг ашигладаг.

Энэ аргын сул тал нь талбайг хадгалах, харьцуулах зэрэгт маш их нөөц шаарддаг явдал юм. Хамгийн энгийн харьцуулах алгоритмыг ашигладаг тул зургийг хатуу тогтоосон нөхцөлд авах ёстой: өнцөг, гэрэлтүүлэг, сэтгэл хөдлөлийн илэрхийлэл гэх мэт мэдэгдэхүйц өөрчлөлтийг зөвшөөрдөггүй.

Нүүрний загварт орсон хэсгүүд

Марковын далд загварууд.

Марковын загварууд нь янз бүрийн процессуудыг загварчлах, хэв маягийг таних хүчирхэг хэрэгсэл юм. Марковын загварууд нь мөн чанараараа дохионы орон зай-цаг хугацааны шинж чанарыг шууд харгалзан үзэх боломжийг олгодог тул яриаг танихад өргөн хэрэглэгдэж, сүүлийн үед дүрс (ялангуяа нүүрний дүрс) ашиглагддаг. Загвар бүр $\lambda = \langle \textbf(A), \textbf(B), \boldsymbol\pi \rangle$ нь $N$ төлөвүүдийн багц юм $S = \(S_1 , S_2 , \ldots , S_N\ ) $, тэдгээрийн хооронд шилжилт хийх боломжтой. Цаг мөч бүрт систем нь хатуу тодорхойлогдсон төлөвт байдаг. Хамгийн түгээмэл $\textit(first-order)$ Марковын загварууд нь дараагийн төлөв нь зөвхөн одоогийн төлөвөөс хамаарна гэж үздэг. Төлөв болгонд шилжих үед симуляцийн системийн гаралтын физик дохиотой тохирох ажиглагдах тэмдэг үүсдэг. Төлөв бүрийн тэмдгийн багц $V = \(v_1 , v_2 , \ldots, v_M \)$, тэмдгийн тоо $M$. Загвараас үүссэн гаралт нь мөн тасралтгүй байж болно. Мөн бүх муж улсын тэмдгийн багц ижил байдаг загварууд байдаг. $t$ үед $q_t = S_j$ төлөвт байгаа тэмдэг $b_(j k) = P (v_(k) | q_i = S_j)$ магадлалтайгаар үүсгэгдэнэ. Ийм бүх магадлалын багц нь $\textbf(B)= \(b_(j k)\)$ матрицыг бүрдүүлнэ.

$\textbf(A) = ||a_(ij)||$ матриц нь нэг төлөвөөс нөгөө төлөвт шилжих магадлалыг тодорхойлдог: $a_(ij) = P (q_(i+1) = S_j | q_i = S_i) $, $1 \le i, j \le N$. $A$ цаг хугацаанаас хамаардаггүй гэж үздэг. Хэрэв муж бүрээс нэг шилжилтээр өөр аль нэгэнд хүрэх боломжтой бол бүх $a_(ij) > 0$ байх ба загварыг ergodic гэж нэрлэдэг. Загвар нь $\boldsymbol\pi = \( \pi_i \)$, $\pi_i = P (q_1 = S_i)$ байх магадлалтай. Ихэвчлэн бодит процессуудад төлөв байдлын дараалал нь ажиглалтаас нуугдаж, тодорхойгүй хэвээр үлддэг бөгөөд зөвхөн системийн гаралт мэдэгдэж байгаа бөгөөд ажиглагдсан тэмдэгтүүдийн дараалал $O = O_1 O_2 \ldots O_T$, ажиглалт бүр $O_t$ тэмдэгт байдаг. $V$-аас, $T$ - дараалсан ажиглалтын тоо. Иймд ийм загваруудыг $\textit(hidden)$ Марковын загвар гэж нэрлэдэг (Hidden Markov Models, $\textit(HMM)$).

Тохируулах параметр бүхий $\boldsymbol\lambda = \langle \textbf(A), \textbf(B) , \boldsymbol\pi \rangle$ загварыг ажиглалтын дарааллыг бий болгоход ашиглаж болно. Үүнийг хийхийн тулд $\boldsymbol\pi$ магадлалын дагуу эхний төлөвийг санамсаргүй байдлаар сонгож, дараа нь алхам бүрт $\textbf(B)$ магадлалыг ашиглан ажиглагдсан тэмдэг, $\ магадлалыг ашиглана. textbf(A)$ нь дараагийн нэг нөхцөлийг сонгоход хэрэглэгддэг. $\lambda$ загвараар $O$ төлөвийн дарааллыг үүсгэх $P$ магадлал: $$ P(O|Q, \lambda) = \prod_(t-1)^T b_(q_t) (O_t) $ $ энд $Q = q_1 q_2 \ldots q_T$ - төлөв байдлын дараалал. Ажиглалтууд нь статистикийн хувьд бие даасан байна гэж үздэг.

Загвар танихад Марковын далд загварыг ингэж ашигладаг. $i$ анги бүр өөрийн $\lambda_i$ загвартай. Хүлээн зөвшөөрөгдсөн дүрс (ярианы дохио, дүрс гэх мэт) нь $O$ ажиглалтын дараалал хэлбэрээр илэрхийлэгддэг. Дараа нь $\lambda_i$ загвар бүрийн хувьд энэ дарааллыг тухайн загвараар үүсгэсэн байх магадлалыг тооцно. Хамгийн их магадлалтай $\lambda_i$ загварыг хамгийн тохиромжтой гэж үзэж, дүрсийг $j$ ангилалд оруулсан.

Үүнтэй холбогдуулан Марковын далд загваруудын гурван үндсэн ажил гэж нэрлэгддэг хэд хэдэн асуулт гарч ирдэг.

$O = O_1 O_2 \ldots O_T$ ба тохируулсан загвар $\boldsymbol\lambda = \langle\textbf(A), \textbf(B), \boldsymbol\pi\rangle$, $P(O) магадлалыг хэрхэн тооцоолох |\lambda )$ өгөгдсөн ажиглалтын дарааллын хувьд энэ загвараар үүсгэгдсэн үү? Энэ ажлыг таних даалгавар гэж нэрлэдэг.

  1. Ажиглалтын дараалалтай байх

$O = O_1 O_2 \ldots O_T$ ба тохируулсан загвар $\boldsymbol\lambda = \langle\textbf(A), \textbf(B), \boldsymbol\pi\rangle$, $Q төлөвийн дарааллыг хэрхэн сонгох = q_1 q_2 \ ldots q_T$ нь оновчтой байх (зарим шалгуурын дагуу энэ асуудлыг аналитик байдлаар шийдвэрлэх боломжгүй)? Өөрөөр хэлбэл, энэ бол тайлбар хийх ажил юм. Энэ нь загварын параметрүүдийг дараагийн залруулга хийхэд шаардлагатай.

  1. Загварын параметрүүдийг хэрхэн тохируулах талаар

$P(O|\lambda)$-г нэмэгдүүлэхийн тулд $\lambda$? Өөрөөр хэлбэл, бид хэрхэн загварыг өөрийн ангилалд илүү нийцүүлэх вэ, тэдгээрийн нэг нь ажиглалтын өгөгдсөн дараалал (эсвэл хэд хэдэн өөр дараалал) юм? Энэ бол суралцах даалгавар юм.

Эхний даалгавар нь яг тодорхой байна аналитик шийдэл, урагш хойш дамжуулах журам гэж нэрлэдэг. Дараагийн хоёр асуудалд яг аналитик шийдэл байхгүй. Хоёрдахь асуудлыг шийдэхийн тулд Витерби алгоритмыг, гурав дахь асуудлыг Баум-Велчийн алгоритмыг ашиглана. Эдгээр хоёр арга нь градиент удмын хувилбарууд бөгөөд оновчлолын аргуудыг ашиглан шийдэгддэг.

Марковын шугаман загвар

Тооцооллыг багасгахын тулд яриа танихад шугаман загваруудыг ашигладаг (Зураг 1). 6. Ийм загварт муж бүр зөвхөн нэг дараагийнхтай байх ба ижил төлөв рүү буцах нь бас боломжтой. Ийм загварууд нь ярианы дохионы цаг хугацааны шинж чанарыг харгалзан үздэг: дохионы хэсгүүдийн тодорхой дараалал, тэдгээрийн харьцангуй байрлал, орон нутгийн суналт эсвэл шахалтын боломж. Энэ нь тэдгээрийг дүрсийг танихад ашиглах боломжийг олгодог.

Хоёр хэмжээст Марковын загваруудын мөн чанар нь нэг хэмжээст шугаман HMM-ээс ялгаатай нь зургийн гажуудал болон хэсгүүдийн харьцангуй байрлалыг хэвтээ ба босоо байдлаар тусад нь биш, харин хоёр чиглэлд нэгэн зэрэг загварчлах боломжийг олгодог. Тооцооллын нарийн төвөгтэй байдлыг багасгахын тулд псевдо-2D HMMs (Pseudo-2D Hidden Markov Models, $\textit(P2D-HMM)$) ашигладаг. Ийм загвар нь доод түвшний хэд хэдэн шугаман босоо загвар ба дээд түвшний нэг шугаман хэвтээ загвараас бүрдэх ба тэдгээрийн оролт нь доод түвшний загваруудын гаралт юм. 7. Бүр

Псевдо-хоёр хэмжээст далд Марковын загвар

Ажиглалтын түүвэр сайтуудыг гаргаж байна

дээд түвшний загварын төлөвт харгалзах доод түвшний загварын төлөв байдлын дараалал орно. Доод түвшний загварууд нь хоорондоо холбоогүй байдаг. Эхэндээ дээд түвшний загварууд нь босоо байсан. Дараагийн ажилд дээд түвшний загваруудыг хэвтээ (зурагт үзүүлсэн шиг) хийсэн бөгөөд ингэснээр доод түвшний босоо загварууд нь нүд нь өөр өөр өндөрт байж болохыг харгалзан үзэх боломжтой болсон. Тиймээс псевдо-хоёр хэмжээст загвар нь орон нутгийн хэв гажилт, зургийн талбайн харьцангуй байрлалыг харгалзан үзэх боломжтой болгодог. Гэхдээ оптик урсгал болон хэв гажилтыг тохируулах бусад аргуудаас ялгаатай нь псевдо-хоёр хэмжээст загвар нь хэв гажилтын шинж чанарыг харгалзан үздэг бөгөөд псевдо-хоёр хэмжээст HMM-ууд нь сургалтын явцад яг ямар хэв гажилт байж болохыг олж мэддэг. Өөрөөр хэлбэл, нүдэнд тохирох хэсэг нь амны хөндий байх ёстой газар хэзээ ч таарахгүй.

SMM-ийн үйл ажиллагааны жишээ. HMM-ийн оролт нь зургийн дөрвөлжин хэсэг юм (Зураг 8). 75(\%)-тай олборлосон бүсүүд бие биетэйгээ давхцаж байгаа нь хамгийн сайн таних нарийвчлалыг өгдөг нь тогтоогдсон.

HMM-ийн хувьд загварыг эхлүүлэх нь чухал юм. Сургалтын багцын бүх зургийг бүх загваруудын анхны хувилбар болгон ашигладаг. Дараа нь ангийн загвар бүрийг өөрийн зураг дээр тохируулна.

HMM-ийн сул тал нь HMM нь ялгах чадваргүй, өөрөөр хэлбэл сурах алгоритм нь зөвхөн загвар бүрийн өөрийн ангид үзүүлэх хариу үйлдлийг хамгийн их байлгах боловч бусад ангиудад үзүүлэх хариу үйлдлийг багасгахгүй бөгөөд нэг ангиудыг нөгөөгөөс ялгах гол шинж чанаруудыг онцолж чаддаггүй. Тиймээс ижил төстэй ангиудыг ялгах чадвар муутай бөгөөд мэдээллийн сангийн хэмжээ ихсэх эсвэл илүү өргөн хүрээнд ашиглах тусам HMM нь найдваргүй болж магадгүй юм.

Олон давхаргат мэдрэлийн сүлжээ.

Олон давхаргат мэдрэлийн сүлжээний (MNN) архитектур нь дараалсан холбогдсон давхаргуудаас бүрддэг бөгөөд давхарга бүрийн нейрон нь өмнөх давхаргын бүх нейронтой оролт, дараагийнх нь гаралттай холбогддог. Шийдвэрлэх хоёр давхарга бүхий мэдрэлийн сүлжээ нь аливаа олон хэмжээст функцийг ямар ч нарийвчлалтайгаар ойртуулж чадна. Нэг шийдвэрийн давхаргатай мэдрэлийн сүлжээ нь шугаман тусгаарлах гадаргууг үүсгэх чадвартай бөгөөд энэ нь тэдний шийдэж чадах асуудлын хүрээг ихээхэн нарийсгадаг, ялангуяа ийм сүлжээ нь "онцгой эсвэл" төрлийн асуудлыг шийдэж чадахгүй; Шугаман бус идэвхжүүлэлтийн функцтэй, хоёр шийдвэрлэх давхарга бүхий мэдрэлийн сүлжээ нь уусмалын орон зайд ямар ч гүдгэр бүс, гурван шийдвэрлэх давхарга бүхий аливаа нарийн төвөгтэй бүс, түүний дотор гүдгэр бус хэсгүүдийг үүсгэх боломжийг олгодог. Үүний зэрэгцээ МНС ерөнхийлэх чадвараа алддаггүй. Сүлжээний нийт алдааг багасгахын тулд жингийн орон зайд градиент буурах арга болох буцах тархалтын алгоритмыг ашиглан MNN-ийг сургадаг. Энэ тохиолдолд алдаа (илүү нарийвчлалтай, жингийн залруулгын утгууд) нейроныг холбосон жингээр дамжин оролтоос гаралт хүртэл эсрэг чиглэлд тархдаг. Нэг давхаргат мэдрэлийн сүлжээний (авто ассоциатив санах ой гэж нэрлэдэг) хамгийн энгийн хэрэглээ бол сүлжээг тэжээгдсэн дүрсийг дахин бүтээхэд сургах явдал юм. Туршилтын зургийг оролт болгон өгч, сэргээн босгосон зургийн чанарыг тооцоолсноор та сүлжээ нь оролтын дүрсийг хэр сайн таньсан болохыг үнэлэх боломжтой. Энэ аргын эерэг шинж чанарууд нь сүлжээ нь гажуудсан, чимээ шуугиантай зургийг сэргээх боломжтой боловч илүү ноцтой зорилгод тохиромжгүй байдаг. MNN нь дүрсийг шууд ангилахад ашиглагддаг - оролт нь ямар нэгэн хэлбэрээр дүрс, эсвэл гаралт дээрх зургийн өмнө нь гаргаж авсан үндсэн шинж чанаруудын багц бөгөөд хамгийн их идэвхжилтэй нейрон нь хүлээн зөвшөөрөгдсөн ангид гишүүнчлэлтэй болохыг илтгэнэ (Зураг 1). 9).

Хамгийн их идэвхжилтэй нейрон (энд эхнийх нь) нь хүлээн зөвшөөрөгдсөн ангид гишүүнчлэлийг илэрхийлдэг. Хэрэв энэ үйл ажиллагаа нь тодорхой босго хэмжээнээс доогуур байвал илгээсэн зураг нь мэдэгдэж буй ангилалд хамаарахгүй гэж үзнэ. Сургалтын үйл явц нь тодорхой ангид хамаарах оролтод оруулсан зургуудын тохирлыг тогтоодог. Үүнийг "хяналттай сургалт" гэж нэрлэдэг. Нүүрний зургаас хүнийг танихад энэ аргыг хэрэглэхэд цөөн тооны хүмүүсийн хандалтыг хянах даалгавруудад тохиромжтой. Энэ нь сүлжээнд шууд зургуудыг харьцуулах боломжийг олгодог боловч ангиудын тоо нэмэгдэхийн хэрээр сүлжээний сургалт, ажиллах хугацаа экспоненциалаар нэмэгддэг тул хайлт зэрэг даалгаврууд нэмэгддэг. ижил төстэй хүнтом мэдээллийн санд хайлт хийх гол шинж чанаруудын авсаархан багцыг гаргаж авах шаардлагатай.

Ялангуяа MNN-ийг нүүрний зарим хэсэг (хамар, ам, нүд) хоорондын зай зэрэг шинж чанарт үндэслэн нүүрний зургийг ангилахад ашиглаж болно. Марковын загвартай хослуулах гэх мэт эрлийз системүүд бас байдаг. Сонгодог MNN-д давхарга хоорондын мэдрэлийн холболтууд бүрэн холбогдсон бөгөөд дүрс нь хоёр хэмжээст боловч нэг хэмжээст вектор хэлбэрээр дүрслэгддэг. Эвлэлийн мэдрэлийн сүлжээний архитектур нь эдгээр дутагдлыг арилгах зорилготой юм. Энэ нь орон нутгийн рецепторын талбарууд (нейронуудын орон нутгийн хоёр хэмжээст холболтыг хангах), хуваалцсан жин (зургийн аль ч хэсэгт тодорхой шинж чанарыг илрүүлэх) болон орон зайн дэд түүвэрлэлт бүхий шаталсан зохион байгуулалтыг ашигладаг. Convolutional Neural Network (CNN) нь масштабын өөрчлөлт, шилжилт хөдөлгөөн, эргэлт, гажуудал зэрэгт хэсэгчилсэн эсэргүүцэл үзүүлдэг. CNN-ийн архитектур нь олон давхаргаас бүрдэх бөгөөд тэдгээр нь тус бүр нь хэд хэдэн хавтгайтай байдаг бөгөөд дараагийн давхаргын нейронууд нь зөвхөн орон нутгийн ойр орчмын өмнөх давхаргын цөөн тооны мэдрэлийн эсүүдтэй холбогддог (хүний ​​харааны адил). кортекс). Нэг хавтгайн цэг бүрийн жин нь ижил байна (хувиралтын давхарга). Хувиралтын давхаргын араас орон нутгийн дундажаар хэмжээсийг нь багасгадаг давхарга ирдэг. Дараа нь дахин convolutional давхарга гэх мэт. Ийм байдлаар шаталсан зохион байгуулалтад хүрдэг. Дараа нь давхаргууд нь илүү их ханддаг Ерөнхий шинж чанарууд, зургийн гажуудлаас бага хамааралтай. CNN-ийг буцаан тархалтын стандарт аргыг ашиглан сургадаг. MNS болон CNN-ийн харьцуулалт нь ангилалын хурд, найдвартай байдлын хувьд хоёуланд нь ихээхэн давуу талтай болохыг харуулсан. Ашигтай өмч CNN-ийн давуу тал нь шатлалын дээд давхаргын гаралт дээр үүссэн шинж чанаруудыг хамгийн ойрын хөршийн аргыг (жишээлбэл, Евклидийн зайг тооцоолох) ашиглан ангилахад ашиглах боломжтой бөгөөд CNN нь зурагнуудад ийм шинж чанарыг амжилттай гаргаж чаддагт оршино. сургалтын багцад байхгүй. CNN нь суралцах, ажиллах өндөр хурдаар тодорхойлогддог. Гэрэлтүүлэг, масштаб, орон зайн эргэлт, байрлал, янз бүрийн сэтгэл хөдлөлийн бага зэрэг өөрчлөгдсөн царайны зургийг агуулсан CNN-ийг ORL мэдээллийн санд турших нь ойролцоогоор 98(\%) таних нарийвчлалыг харуулсан бөгөөд мэдэгдэж буй царайнуудын хувьд тэдгээрийн дүрсний хувилбаруудыг танилцуулсан боловч тодорхойгүй байна. сургалтын багцад. Энэхүү үр дүн нь энэхүү архитектурыг орон зайн объектын дүрсийг таних чиглэлээр цаашид хөгжүүлэх ирээдүйтэй болгож байна. MNN-ийг мөн тодорхой төрлийн объектыг илрүүлэхэд ашигладаг. Нэмж дурдахад, аливаа бэлтгэгдсэн MNN нь тодорхой ангиллыг найдвартай илрүүлэхийн тулд дүрсийг "тэдний" ангилалд хамаарах эсэхийг тодорхой хэмжээгээр тодорхойлж чадна. Энэ тохиолдолд гаралтын ангиуд нь тухайн зургийн төрөлд хамаарах ба хамааралгүй ангиуд байх болно.


Зургийн ангилалд зориулсан олон давхаргат мэдрэлийн сүлжээ

Gabor Wavelet Networks (GWN).

Энэ арга нь Габор долгионы салангид шугаман хослол болох Габор долгионы загвар (GWT) ашиглан бодит цагийн нүүрийг хянах зориулалттай. Нүүрний дүрслэлийн нарийвчлалыг GWN дахь Габор долгионы тоогоор зохицуулж, олон нүүрийг нэг GWT-ээр дүрслэх боломжийг олгодог гэдгийг анхаарах нь чухал. Энэхүү дүрслэл нь дур зоргоороо аффины хувиргалт хийх, градиент буурах аргыг ашиглан аффины параметрүүдийг хурдан тооцоолох боломжийг олгодог. Тиймээс, нүүр царайг хянахдаа энэ арга нь түүний чиг баримжааг тодорхойлдог боловч эргэлтийг хязгаарладаг: голчлон хавтгайд эргэлт, босоо тэнхлэгийн эргэн тойронд бага зэрэг орон зайн эргэлтийг зөвшөөрдөг.

Хопфилд мэдрэлийн сүлжээ.

Хопфилд NN (HNS) нь нэг давхарга бөгөөд бүрэн холбогдсон (өөртөө нейронуудын хооронд ямар ч холболт байхгүй), түүний гаралт нь оролттой холбогдсон байна. MNS-ээс ялгаатай нь NSC нь амралт юм, өөрөөр хэлбэл тодорхой анхны байрлалд суурилуулсан бөгөөд энэ нь тогтвортой байдалд хүрэх хүртэл ажилладаг бөгөөд энэ нь түүний гаралтын утга болно. NSCs нь ассоциатив санах ой болон оновчлолын асуудлыг шийдвэрлэхэд ашиглагддаг. Эхний тохиолдолд мэдрэлийн сүлжээг багшгүйгээр сургадаг (жишээлбэл, Хебб дүрмийн дагуу), хоёр дахь тохиолдолд нейронуудын хоорондох жин нь эхлээд шийдэж буй асуудлыг кодчилдог. Бүх нейроныг нэгэн зэрэг дахин тооцоолох үед NSC-ууд синхрон, санамсаргүй байдлаар сонгосон нейроныг дахин тооцоолох үед асинхрон байж болно. Ляпуновын аргыг үндэсний хөдөө аж ахуйн системийн үйл ажиллагааны динамикийг судлахад ашигладаг. Асинхрон ҮСХ нь үргэлж тогтвортой цэгүүд рүү нийлдэг бөгөөд синхрон ҮСХ-ийн татагч нь тогтвортой суурин цэгүүд бөгөөд хоёр урттай мөчлөгийг хязгаарладаг. Тиймээс ҮСХ нь анхны төлөвөөс сүлжээний энергийн хамгийн ойрын орон нутгийн хамгийн бага хэмжээнд нийлдэг, нейронуудын төлөв байдал нь таних асуудлын хувьд сэргээгдсэн дүр төрх, оновчлолын асуудлыг шийдэх шийдэл юм. Оновчлолын асуудалтай холбоотой дэлхийн хамгийн бага хэмжээг хайхын тулд ҮАБЗ-ийн стохастик өөрчлөлтүүдийг ашигладаг.

NSH-ийг ассоциатив санах ой болгон ашиглах нь гажуудсан дүрсийг оролтод оруулах үед сүлжээнд сургагдсан зургуудыг үнэн зөв сэргээх боломжийг олгодог. Энэ тохиолдолд сүлжээ нь хамгийн ойрын (орон нутгийн хамгийн бага эрчим хүчний утгаараа) дүрсийг "санаж", таних болно. Энэ ажиллагааг мөн автомат ассоциатив санах ойн дараалсан хэрэглээ гэж үзэж болно. Автомат ассоциатив санах ойноос ялгаатай нь NSH нь дүрсийг төгс сэргээх болно.

Хүний царайны зураг дээр суурилсан таних системийг хөгжүүлэх ажил хэдэн арван жилийн турш үргэлжилж байгаа ч хүний ​​царайны зураг дээр суурилсан үр дүнтэй таних алгоритмыг бий болгох ажил хараахан дуусаагүй байна.

Ихэнх орчин үеийн автомат царай таних системүүдийн хувьд гол ажил бол өгөгдсөн нүүрний зургийг мэдээллийн сангаас авсан нүүрний зурагтай харьцуулах явдал юм. Энэ тохиолдолд нүүр царайг автоматаар таних системийн шинж чанарыг танихаас буруугаар татгалзах (мэдээллийн санд байгаа царайны зургийн хувьд танигдаагүй царайгаар шийдвэр гаргадаг) болон алдаатай таних магадлалыг тодорхойлох замаар үнэлдэг. Автомат царай таних системийг үнэлэхийн тулд алдааны магадлалаас гадна нарийн төвөгтэй дэвсгэр, гэрэлтүүлгийн өөрчлөлт, үсний засалт зэрэгтэй хослуулсан дүрсний эвдрэлийг ихэвчлэн ашигладаг.

Нүүр царай таних практик автомат системийг бий болгох алгоритм эсвэл бүлэг царайг таних алгоритмын сонголт нь тухайн системийн үйл ажиллагааны нөхцөлтэй холбоотой хязгаарлалттай нийцсэн тодорхой системийн гүйцэтгэлийн шинж чанарыг үнэлэх системд суурилсан байх ёстой. зураг төслийн үе шатанд шууд тодорхойлогддог.

Биометрийн нүүр царай таних системийг Барилгын яамнаас боловсруулж эхэлсэн Оросын хотуудын "ухаалаг хот" стандартад оруулахаар төлөвлөж байна. Энэ тухай тус газрын орлогч дарга Андрей Чибис “Известия” сонинд ярьжээ. Ийм технологийг нийтийн тээвэрт ашиглахад тохиромжтой гэж тэр тэмдэглэв: Зорчигч автобусанд сууж, програм түүнийг таньж, банкны данснаас аяллын мөнгийг хасдаг. Тус яам Хятадын хотуудын туршлагаас танилцаж, ижил төстэй технологийг Орос улсад түгээх бодолтой байна.

Тус яам нь "Ростелеком"-той хамтран биометрийн технологи, Оросын хотуудад болж буй үйл явдлын дүн шинжилгээг хэрэгжүүлэхэд Хятадын компаниуд, тэр дундаа Huawei компанийг татан оролцуулахаар төлөвлөж байна. Энэ тухай Барилга, орон сууц, нийтийн аж ахуйн дэд сайд Андрей Чибис “Известия” сонинд ярьжээ. Түүний хэлснээр, хэрэв энэ систем амжилттай болвол хотуудын тав тухыг сайжруулах хамгийн бага шийдэл болох "ухаалаг хот" стандартын үндэс суурь болно. Тус хэлтэс стандартыг боловсруулж эхлээд байна.

Тус яамны төлөөлөгчид Хятадад айлчилж, орчин үеийн технологи, тэр дундаа биометрийн үзүүлэлтүүд хэрхэн ажиллаж байгааг үнэлэхээр төлөвлөж байна.

Миний мэдэж байгаагаар одоо Москвад ийм технологи нэвтрүүлэх талаар хэлэлцэж байна. Мэдээжийн хэрэг, карт ашиглах шаардлагаас болж зорчигчдын суух хугацаа хойшилдог. Нүүр царай таних алгоритм нь иймэрхүү ажилладаг: зорчигч метро эсвэл автобусанд ороход програм нь түүнийг таньж, банкны данснаас аяллын мөнгийг хасдаг гэж Андрей Чибис жишээ татав.

Олон хотод нэлээд тооны камер суурилуулсан, өөрөөр хэлбэл дэд бүтцийг бүхэлд нь бий болгосон гэж албаны хүн онцоллоо. Асуулт нь зохицуулалтын зохицуулалт, туршилтын төслүүдийн хэрэгжилтийн тухай юм - хэрвээ тэд амжилттай болбол цаашдын үйл явц хурдан явагдах болно: "Бид метронд жетоноос хурдан холдсон шиг бид турникээс холдож чадна."

Нийтийн тээврийн хэрэгслээр зорчиж буй зорчигчдыг тодорхойлох, тэр дундаа аяллын төлбөрийг төлөх нь системийг ашиглах хамгийн тод боломжуудын нэг гэдгийг Ростелекомын хэвлэлийн алба тэмдэглэв.

Дэлхий дээр бодит жишээнүүд байдаг бөгөөд Орос улсад ойрын ирээдүйд ийм шийдлүүдийг бий болгох төлөвтэй байна гэж тус компани "Известия" сонинд мэдэгдэв.

Үүний хүрээнд хөгжүүлэхээр төлөвлөж буй “Ухаалаг хот” төсөл шинэ технологи, зургаан жилийн турш зориулагдсан. Андрей Чибисийн хэлснээр, энэ хугацаанд нүүр царай таних систем хаа сайгүй гарч ирнэ гэж хэн ч хэлэхгүй, гэхдээ бид энэ чиглэлд шилжих хэрэгтэй. “Энэ бол аюулгүй байдлын асуудал төдийгүй тав тухтай байдлын асуудал юм. Бид энэ технологийг судалж, ойрын ирээдүйд хэрэгжүүлэх боломжийн талаар шийдвэр гаргана - мэдээжийн хэрэг, хамгийн түрүүнд түүний өртөг" гэж тэр хэллээ.

Компьютерийн харааны чиглэлээр мэргэшсэн VisionLabs компанийн гүйцэтгэх захирал Александр Ханин камер, сервер суурилуулах үйл явц нь техникийн хувьд энгийн тул ойрын ирээдүйд ийм системийг хаа сайгүй хэрэгжүүлэх боломжтой гэж тэмдэглэв. Тэднийг сураггүй алга болсон хүмүүсийг хайхад ашиглаж болно гэж тэр үзэж байна. Камер бүрт холбогдох зардал нь ашиглалтын хувилбар болон камерын төрлөөс хамаарна: 200 рубльээс хэдэн мянга хүртэл.

Москвагийн цахим технологийн дээд сургуулийн харилцаа холбооны системийн хэлтсийн дарга Александр Бахтин хотын сүлжээнүүд ийм мэдээлэл дамжуулахад бэлэн байгааг тэмдэглэв. Гэсэн хэдий ч шинэ технологи нэвтрүүлэх эхний шатанд хувийн нууцыг зөрчих эрсдэл үргэлж байдаг. Мэдээллийг таслан зогсоох олон цэг байдаг. Гэхдээ туршилт хийсний дараа систем баригдаж, үр дүнтэй ажилладаг.

Эмнэлэгт томограф нь зарим автобусны видео бичлэгээс хамаагүй илүү мэдээлэл үүсгэдэг. Үүнийг хэн, ямар зорилгоор задлан шинжилдэг вэ гэдэг асуудал. Хувийн мэдээллийг зөвшөөрөлгүй ашигладаг ажилчдаас хууль тогтоомж биднийг хамгаалахыг хүсч байна" гэж Александр Бахтин "Известия" сонинд ярьжээ.

"Ростелеком" ийм мэдээллийн эргэлт нь маш эмзэг сэдэв гэдгийг хүлээн зөвшөөрч байгаа тул бусад орнуудын нэгэн адил Орос улсад төрийн хяналтан дор нэгдсэн биометрийн системийг бий болгож байна. Эхний ээлжинд Төв банктай хамтран банкны салбарын эрх ашигт нийцүүлэн хэрэгжүүлж байна. Музейд хүрэлцэн ирэхгүйгээр нүүр царай таних туршилтууд аль хэдийн хийгдсэн бөгөөд энэ системийг ирээдүйд хөгжүүлнэ гэж компани итгэлтэй байна.

2017 оны 9-р сард Москвагийн эрх баригчид нүүр царай таних функцтэй видео тандалтын системийг нэвтрүүлж байгаагаа зарлав. Нийслэл хотын сүлжээнд 160 мянган видео камер багтаж, орон сууцны барилгын орцны 95 хувийг хамарсан байна. Бичлэг дээрх нүүр царайг сканнердсан бөгөөд шаардлагатай бол өгөгдлийг янз бүрийн мэдээллийн сан дахь мэдээлэлтэй харьцуулж болно - жишээлбэл, хууль сахиулах байгууллагууд, Москва хотын захирагчийн портал дээр заасан гэмт этгээдийг хайх үед. Энэхүү систем нь видеон дээрх хүн, түүний хүйс, насыг тодорхойлох боломжтой.

Ростек улсын корпораци 2018 оны дэлхийн аварга шалгаруулах тэмцээний үеэр нүүр царай таних технологийг ашигласан. Жишээлбэл, түүний тусламжтайгаар шүүхийн шийдвэрээр спортын арга хэмжээнд оролцохыг хориглосон шүтэн бишрэгчийг тодорхойлох боломжтой байв. Алгоритм нь нүүр царайг 99% хүртэл нарийвчлалтайгаар таних боломжийг олгодог. Тус улсын корпораци нэг тэрбум хүний ​​дундаас тодорхой хүнийг хайхад хагас секундээс бага хугацаа зарцуулдаг гэж тэмдэглэжээ.

Цаашлаад нүүр царайг таних замаар бид нүүр царайг сонгох, түүнийг хэвийн болгох үе шатууд, тухайлбал онцлог шинж чанаруудыг гаргаж авах, стандарттай харьцуулах зэргийг ойлгох болно. Бид эдгээр хоёр асуудлыг шийдвэрлэхэд ашигладаг үндсэн аргуудыг танилцуулж байна.

Онцлог шинж чанарыг задлах аргуудыг хоёр бүлэгт хувааж болно. Эдгээр нь орон нутгийн онцлог, дэлхийн нүүрний онцлогийг ашигладаг аргууд юм. Орон нутгийн онцлогийг ашиглах үед алгоритм нь нүүрний салангид хэсгүүдийг (нүд, хамар, ам гэх мэт) тодорхойлж, нүүр царайг сонгох эсвэл танихад ашигладаг. Глобал функцуудыг ашиглах үед алгоритм нь нүүр царайг бүхэлд нь хамарч ажилладаг.

Орон нутгийн онцлогтой ажиллах аргууд нь:

    Габор шүүлтүүр;

    уян харимхай графикийг харьцуулах арга;

    нүүрний контурын загварууд;

    хамгийн мэдээлэл сайтай газруудын арга;

    Марковын далд загварууд;

    хувиргах загварууд;

  • нүүрний геометрийн шинж чанарт суурилсан аргууд;

    стандартын харьцуулалтад үндэслэсэн арга;

    мэдрэлийн сүлжээнүүд.

Глобал шинж чанаруудыг ашиглах аргууд нь:

    ялгах арга;

  • Габор шүүлтүүр;

    мэдрэлийн сүлжээнүүд.

Таны харж байгаагаар орон нутгийн нүүрний онцлогийг задлах болон дэлхийн онцлогийг задлахад ижил аргыг ашиглаж болно.

    Габор шүүлтүүр;

  • мэдрэлийн сүлжээнүүд.

Бүх ангилагчдыг дараах бүлгүүдэд хувааж болно.

    математик статистикийн зарчимд суурилсан статистикийн аргууд;

    тусгаарлах гипер гадаргууг барихад суурилсан аргууд;

    боломжийн зарчимд суурилсан аргууд;

    тохиолдлын тодорхойлолт дээр суурилсан аргууд;

    биологийн мэдрэлийн сүлжээг судалсны үндсэн дээр боловсруулсан аргууд.

Онцлог шинж чанарыг задлах, ангилах одоо байгаа аргуудын тоо хязгааргүй юм. Дараа нь бид зөвхөн хамгийн алдартай аргуудыг авч үзэх болно.

3.4.2. Орон нутгийн шинж чанарыг шинжлэхэд үндэслэсэн аргууд

Энэ бүлгийн бүх аргууд нь нүүрний онцлог шинж чанарыг нутагшуулж, тэдгээрийн алгоритмыг хэрэгжүүлдэг.

Уян хатан харагдах загварууд

Нүүр царайг таних асуудлыг шийдвэрлэх зарим аргууд нь "уян царайны загвар" (Уян хатан загвар) гэсэн ойлголтыг ашигладаг бөгөөд энэ нь эргээд үндсэн бүрэлдэхүүн хэсгүүдэд үндэслэн сэргээн босгосон объектууд юм. Эдгээр аргуудын хувьд таних нь нүүрний хэлбэрийг харьцуулах үндсэн дээр хийгддэг. Контурыг ихэвчлэн толгой, чих, уруул, хамар, хөмсөг, нүдний зураасаар зурдаг. Контурыг гол байрлалаар төлөөлдөг бөгөөд тэдгээрийн хооронд контурт хамаарах цэгүүдийн байрлалыг интерполяцаар тооцдог. Контурыг нутагшуулахын тулд янз бүрийн аргууд нь априори мэдээлэл болон сургалтын багцын дүн шинжилгээнээс олж авсан мэдээллийг хоёуланг нь ашигладаг.

Уг ажилд контурт тохирох гол цэгүүдийг сургалтын зураг дээр гараар байрлуулсан болно. Эдгээр цэгүүдийн багц буюу анхны шинж чанарууд нь нүүрний хэлбэрийн анхны загваруудыг (ОУВС) төлөөлдөг. Дараа нь эдгээр шинж чанаруудыг үндсэн бүрэлдэхүүн хэсгийн аргыг ашиглан багасгаж, тэдгээрийн үндсэн дээр дундаж MFL-ийг бий болгодог. Энэ нь нүүрний загварын хэлбэрийг өөрчлөх боломжийг бүрдүүлдэг бөгөөд үүний дагуу багасгасан функцүүдийн орон зайд параметрүүдийг өөрчлөх замаар нүүрний хэлбэрийн уян хатан загварыг (EMFL) бий болгодог. Таних үйл явцын явцад EMFL нь хүлээн зөвшөөрөгдсөн нүүрний дүрс дээр "сунадаг" бөгөөд үүний үр дүнд загварын хэлбэрийн шинэ параметрүүд нь хүлээн зөвшөөрөгдсөн дүрсийг ангилах түлхүүр юм.

Нүүрэн дээрх контурыг хайхын тулд Active Shape Models алгоритмыг ашиглахыг санал болгож байна. Контурыг таних гол ажил бол эдгээр контурыг зөв сонгох явдал юм. Ерөнхийдөө энэ ажлыг нарийн төвөгтэй байдлын хувьд дүрсийг танихтай харьцуулж болно. Нэмж дурдахад энэ аргыг ашиглах нь таних ажилд хангалтгүй юм.

Цагаан будаа. Сургалтын багцаас нүүрэн дээрх цэгүүдийн байршил

Цагаан будаа. Нүүрний хэлбэрт үндсэн бүрэлдэхүүн хэсгүүдийн нөлөө

    Зөвхөн Москвад л гэхэд 150,000 гаруй гаднах видео хяналтын камерын сүлжээ аль хэдийн байгаа бол бид юу хэлэх вэ. Тэднээс нуугдаж байгаа зүйл байхгүй, энэ нь хүмүүсийг бодоход хүргэдэг ч "хяналт"-ын цар хүрээ тийм ч их биш юм. Сүлжээнд нүүр царай таних хүчирхэг систем ашигладаг ч ажиллахад маш их эрчим хүч шаардагддаг тул 2-4 мянган камер л бодит цагийн горимд ажилладаг. Хүн амын массыг хянах нь аймшигтай хэвээр байгаа тул энэ технологийн бодит давуу тал дээр анхаарлаа хандуулах нь зүйтэй. Гэхдээ хамгийн түрүүнд хийх зүйл.

    Нүүр царай таних систем хэрхэн ажилладаг вэ?

    Та нүүр царайг хэрхэн таньж, таних талаар бодож үзсэн үү? Компьютер үүнийг хэрхэн хийдэг вэ? Мэдээжийн хэрэг, хүний ​​царай нь дүрслэхэд хялбар тодорхой шинж чанартай байдаг. Нүдний хоорондох зай, хамрын байрлал, өргөн, хөмсөг, эрүүний хэлбэр - энэ бүх нарийн ширийн зүйлийг та өөр хүн рүү харахад ухамсаргүйгээр анзаардаг. Компьютер энэ бүгдийг тодорхой үр ашигтай, нарийвчлалтайгаар хийдэг, учир нь эдгээр бүх хэмжүүрүүдийг нэгтгэснээр математикийн томьёог олж авдаг. хүний ​​царай.

    Тэгэхээр царай таних төхөөрөмж одоогоор хэр сайн ажиллаж байна вэ? Маш сайн, гэхдээ тэр заримдаа алдаа гаргадаг. Хэрэв та Facebook эсвэл өөр платформ дээр нүүр царай таних программ хангамжтай тааралдсан бол үнэн зөв байдаг шиг олон инээдтэй үр дүн байгааг анзаарсан байх. Гэсэн хэдий ч технологи нь 100 хувийн нарийвчлалтай ажиллахгүй байгаа ч өргөн тархсан ашиглахад хангалттай юм. Тэгээд бүр чамайг сандаргана.

    NEC-ийн Пол Хови хэлэхдээ, тэдний царай таних систем нь нүүр царайг хэн нэгний танигчийг хайж байдаг.

    "Жишээ нь, олон хүмүүс нүдний хоорондох зайг өвөрмөц шинж чанар гэж үздэг. Эсвэл энэ нь эрүүгээс духан хүртэлх зай болон бусад бүрэлдэхүүн хэсгүүд байж болно. Ялангуяа чухалд тооцогдох 15-20 хүчин зүйлээс гадна тийм ч ач холбогдолгүй болсон бусад хүчин зүйлийг харгалзан үздэг. Тухайн хүний ​​толгойн 3D дүрсийг бүтээдэг тул хэсэгчлэн битүүмжилсэн ч яг таарч тохирох хувилбарыг олж авах боломжтой. Дараа нь систем нүүрний гарын үсгийг авч мэдээллийн баазаар дамжуулдаг.”

    Та царай таних программ хангамжийн талаар санаа зовох ёстой юу?

    Юуны өмнө нүүр царай таних нь өгөгдөл юм. Мэдээллийг ихэвчлэн зөвшөөрөлгүйгээр цуглуулж, хадгалж болно. Мэдээллийг цуглуулж, хадгалсны дараа хакердах боломжтой. Нүүр царай таних программ хангамжийн платформууд ямар нэгэн томоохон хакердалтыг хараахан хараагүй байгаа ч технологи хөгжихийн хэрээр таны биометрийн мэдээлэл улам олон хүний ​​гарт орж байна.

    Мөн өмчлөлийн асуудал бий. Ихэнх хүмүүс Facebook гэх мэт олон нийтийн мэдээллийн хэрэгслийн платформд бүртгүүлэхдээ тэр мөчөөс эхлэн өгөгдөл нь Facebook-т харьяалагддаг гэдгийг мэддэггүй. Царай таних системийг ашигладаг компаниудын тоо нэмэгдэж байгаа тул удахгүй та өөрийгөө аюулд өртөхийн тулд интернетэд өөрийн зургаа байршуулах шаардлагагүй болно. Тэд аль хэдийн тэнд хадгалагдаж, удаан хугацаанд хадгалагдаж байна.

    Програм хангамжийн тухай ярихад тэд бүгд өөр өөрөөр ажилладаг боловч үндсэндээ ижил төстэй арга, мэдрэлийн сүлжээг ашигладаг. Нүүр царай бүр нь олон өвөрмөц шинж чанартай байдаг (дэлхий дээр хоёр ижил царайг олох боломжгүй, гэхдээ хүн төрөлхтний түүхэнд ийм олон байсан!). Жишээлбэл, FaceIt програм хангамж нь эдгээр функцийг зангилаа гэж тодорхойлдог. Нүүр бүр нь бидний өмнө дурдсантай адил ойролцоогоор 80 зангилааны цэгийг агуулдаг: нүдний хоорондох зай, хамрын өргөн, нүдний нүхний гүн, эрүүний хэлбэр, эрүүний урт. Эдгээр цэгүүдийг хэмжиж, тоон код - "нүүрний хээ" -ийг үүсгэж, дараа нь мэдээллийн санд оруулна.

    Өмнө нь царай таних нь мэдээллийн сангаас бусад 2D зургийг харьцуулах эсвэл танихын тулд 2D зураг дээр тулгуурладаг байсан. Хамгийн их үр ашигтай, нарийвчлалтай байхын тулд зураг нь камер руу шууд харж буй царай байх ёстой, гэрлийн тархалт багатай, нүүрний тодорхой илэрхийлэлгүй байх ёстой. Мэдээжийн хэрэг, энэ нь муу ажилласан.

    Ихэнх тохиолдолд зургийг тохиромжтой орчинд бүтээгээгүй. Бага зэрэг хөнгөн тоглох нь системийн үр ашгийг бууруулж, доголдлыг өндөр түвшинд хүргэж болзошгүй юм.

    2D-г 3D танилтаар сольсон. Энэхүү сүүлийн үеийн програм хангамжийн чиг хандлага нь нүүр царайг өндөр нарийвчлалтайгаар танихын тулд 3D загварыг ашигладаг. Хүний нүүрний гадаргуугийн 3D дүрсийг бодит цаг хугацаанд нь авснаар уг программ нь тухайн сэдвийг тодорхойлохын тулд нүдний хонхорхой, хамар, эрүүний муруй зэрэг хатуу эд, яс хамгийн тод илэрдэг онцлог шинж чанаруудыг онцолж өгдөг. Эдгээр хэсгүүд нь өвөрмөц бөгөөд цаг хугацааны явцад өөрчлөгддөггүй.

    Гэрэлтүүлгийн нөлөөнд автдаггүй гүн болон хэмжилтийн тэнхлэгийг ашиглан 3D царай таних системийг харанхуйд ч ашиглаж, объектыг өөр өөр өнцгөөс (профайл дээр ч) таних боломжтой. Ийм программ хангамж нь хүнийг таних хэд хэдэн үе шатыг дамждаг.

  • Илрүүлэх: Одоо байгаа гэрэл зураг (2D) эсвэл видеог дижитал сканнердах замаар зураг авах, тухайн объектын шууд зургийг (3D) гаргах.
  • Зохицуулах: Нүүр царайг тодорхойлсны дараа систем нь толгойн байрлал, хэмжээ, байрлалыг тэмдэглэдэг.
  • Хэмжилт: Систем нь нүүрний муруйг миллиметрийн нарийвчлалтайгаар хэмжиж, загвар үүсгэдэг.
  • Төлөөлөл: Систем нь загварыг өвөрмөц код болгон хөрвүүлдэг. Энэ код нь загвар бүрт нүүрний онцлог, шинж чанарыг илэрхийлсэн тооны багцыг өгдөг.
  • Харьцуулалт: Хэрэв зураг нь 3D бөгөөд мэдээллийн санд 3D дүрс байгаа бол зургийг өөрчлөхгүйгээр харьцуулалт үргэлжилнэ. Гэхдээ хэрэв мэдээллийн сан нь хоёр хэмжээст зургуудаас бүрддэг бол гурван хэмжээст дүрсийг өөр өөр бүрэлдэхүүн хэсгүүдэд (нүүрний ижил шинж чанарыг өөр өөр өнцгөөс авсан хоёр хэмжээст гэрэл зураг гэх мэт) задалж, 2D дүрс болгон хувиргадаг. Тэгээд дараа нь тохирох нь мэдээллийн сангаас олддог.
  • Баталгаажуулалт эсвэл таних: Баталгаажуулах явцад тухайн зургийг мэдээллийн сан дахь зөвхөн нэг зурагтай (1:1) харьцуулна. Хэрэв зорилго нь таних юм бол зургийг өгөгдлийн сан дахь бүх зурагтай харьцуулж, хэд хэдэн таарах боломжтой (1: N). Шаардлагатай бол нэг эсвэл өөр аргыг ашигладаг.

Нүүр царай таних системийг хаана ашигладаг вэ?

Өмнө нь эрх баригчид олон хүн дундаас санамсаргүй царайг хайхад ашигладаг байсан тул нүүр царай таних системийг голчлон хууль сахиулах байгууллагад ашигладаг байсан. Зарим төрийн байгууллагууд аюулгүй байдлыг хангах, сонгогчдын булхайг арилгах зорилгоор ижил төстэй системийг ашигласан.

Гэсэн хэдий ч, ийм програм хангамж түгээмэл болох бусад олон нөхцөл байдал байдаг. Системүүд хямдарч, түгээлт нь нэмэгдэж байна. Тэд одоо банк, нисэх онгоцны буудлуудад ашигладаг камер, компьютерт нийцдэг. Аялал жуулчлалын агентлагууд сайн дураараа мэдээлэл өгсөн зорчигчдын аюулгүй байдлын үзлэгийг түргэн шуурхай явуулах зорилгоор "туршлагатай аялагч" хөтөлбөр хэрэгжүүлэхээр ажиллаж байна. Хүмүүс дотоод мэдээллийн сангийн нүүр царайтай таарч буй царай таних системээр дамжвал нисэх онгоцны буудлын дараалал илүү хурдан хөдөлнө.

Бусад боломжит хэрэглээнд АТМ болон бэлэн мөнгө түгээгч орно. Програм хангамж нь үйлчлүүлэгчийн нүүр царайг хурдан шалгах боломжтой. Үйлчлүүлэгчийн зөвшөөрлийн дараа АТМ эсвэл терминал нь нүүрний зургийг авдаг. Програм хангамж нь үйлчлүүлэгчийг хувийн мэдээллийг хулгайлах, залилан хийх гүйлгээнээс хамгаалах нүүрний хэвийг бий болгодог - АТМ өөр царайтай хүнд мөнгө өгөхгүй. Танд ПИН код ч хэрэггүй.

Ид шид үү? Технологи!

Ялангуяа чухал бөгөөд сонирхолтой нь банкны шилжүүлгийн салбарт нүүр царай таних технологийг хөгжүүлэх явдал байж болох юм. Нөгөө өдөр Оросын банк Otkritie нь Otkritie.Transfers гар утасны аппликейшн дээрх гэрэл зургийг ашиглан мөнгө шилжүүлэх гэсэн Нээлттэй Гараж технологийн брэндийн дор боловсруулсан өөрийн өвөрмөц шийдлийг танилцуулав. Та карт эсвэл утасны дугаар оруулахын оронд шилжүүлэг хийх шаардлагатай хүнийхээ зургийг авахад л хангалттай. Нүүр царай таних систем нь зургийг лавлагаатай (банкнаас карт олгох үед хийсэн) харьцуулж, нэр, овог нэрийг нь зааж өгнө. Картаа сонгоод дүнгээ оруулахад л хангалттай. Хамгийн чухал зүйл бол гуравдагч этгээдийн банкны үйлчлүүлэгчид энэ функцийг ашиглан Открыти үйлчлүүлэгчдэд шилжүүлэг хийх боломжтой байдаг - шилжүүлгийг илгээгч нь Оросын аль ч банкны картыг ашиглаж болно.

“Банкны картын дугаарын оронд харилцагчийнхаа зургийг ашиглах нь мэдрэлийн сүлжээний нүүр таних системийг ашиглахад үндэслэсэн онлайн шилжүүлгийн цоо шинэ хандлага бөгөөд үйлчлүүлэгчийг биометрийн мэдээллээр өндөр нарийвчлалтайгаар таних боломжийг олгодог. " гэж Откритие банкны Түншлэлийн системийг хөгжүүлэх хэлтсийн дарга Алексей Матвеев хэлэв. - Энэхүү үйлчилгээ нь хэрэглэгчдэд мөнгө шилжүүлэг хийх цоо шинэ амьдралын хувилбаруудыг нээж өгдөг. Одоогоор дэлхийн санхүүгийн зах зээлд оролцогчдын аль нь ч үйлчлүүлэгчиддээ ийм үйлчилгээг санал болгодоггүй” гэж мэдэгджээ.

Гар утасны програм "Открытие. Орчуулга" боломжтой.



© mashinkikletki.ru, 2024
Zoykin reticule - Эмэгтэйчүүдийн портал