Тээврийн хэрэгслийн дугаар танилтын системийн хувьд улс орон болгон өөрсдийн стандарттай тул өөрсдийн хүчээр хөгжүүлж ирэх нь стратегийн өндөр ач холбогдолтой билээ. Харамсалтай Монгол улсын хувьд ихэнх зогсоолын болон хамгаалалтын камернуудад ашиглагдаж байгаа системийн хувьд гадаад орны бүтээгдэхүүнийг шууд худалдан авч ашигласан байдаг.

Энэ удаагийн тэмцээнээр бид бүхэн энэхүү асуудлыг шийдэхэд хувь нэмэр болох Монгол Улсын тээврийн хэрэгслийн дугаар танилтын даалгаврыг оруулж байна.
Жишээлбэл:

зурагнаас 7276УНХ гэж таамаглах юм.

Энэхүү таск нь хиймэл оюун тэр дундаа Computer Vision-ы салбарт олон жил судлагдаж ирсэн билээ. Мөн энэхүү салбарт гарж байгаа сүүлийн ололт амжилтын үр дүнд маш өндөр нарийвчлалтай танин унших системүүд олноор гарсаар байгаа.

MLUB-н залуус бид ч гэсэн энэ тэмцээний өмнө өөрсдийн чадлаар тээврийн хэрэгслийн дугаар танилтын системийг хөгжүүлсэн. Тэр системийнхээ демо бичлэгийг оруулсан байгаа.
https://www.linkedin.com/feed/update/urn:li:activity:6711642928223281152/
Та бүхнийг бидний хийсэн системээс илүү нарийвчлалтай үр дүн гаргана гэж найдаж байна.

Тэмцээн эхлэх: 2020/10/01
Тэмцээний бүртгэл бөглөх эцсийн хугацаа: 2020/10/15
Тэмцээний журмыг зөвшөөрөх: 2020/10/25 (Энэ хугацаанаас өмнө тэмцээний журмыг зөвшөөрсөн байх)
Баг үүсгэх эцсийн хугацаа: 2020/10/27
Тэмцээн дуусах: 2020/10/31, 23:59
Код болон шийдлээ явуулах хугацаа: 2020/11/02
Шалгарсан багуудад мэдэгдэх хугацаа: 2020/11/05

  • R эсвэл Python хэлний аль нэг дээр хийж болно
  • Шалгарсан багууд хамгийн сайн онооны Submission-г гаргаж авахад ашигласан кодыг зохион байгуулагчид хүргүүлсэн зааврын дагуу ирүүлнэ
  • Код нь коммент, тайлбартай байна
  • 3дагч компанийн үйлчилгээг жишээлбэл Google, Microsoft -ын Vision API ашиглахгүй байх
  • Үүсгэсэн моделийн хэмжээ нийтдээ 200mb-аас хэтрэхгүй байх.

Тэмцээнийг Levenshtein Mean хэмжүүрээр байр эзлүүлнэ. Levenshtein Similarity нь 2 текстийн төстэй байдлыг илэрхийлэх ба яг ижил бол 0, ялгаатай бол хэдэн элемент өөрчилж байж ижил болохыг илтгэх хэмжүүр байна.

Жишээ:

>>> plate_true = '1514УБС'
>>> plate_pred = '1511УВС'
>>> levenshtein(plate_true, plate_pred)
>>> 2
>>> plate_true = '1514УБС'
>>> plate_pred = '1514УБС'
>>> levenshtein(plate_true, plate_pred)
>>> 0

n – тестийн зурагны тоо

Нийт шагналын сан 1’000’000₮
1-р байр 500’000₮
2-р байр 300’000₮
3-р байр 200’000₮

Kaggle тэмцээнд хэрхэн оролцдог вэ?

  1. Тэмцээнд нэгдэх буюу join хийх
    Тэмцээний тухай уншиж танилцах, дүрэмтэй танилцаж зөвшөөрөн дата өгөгдөл дээр ажиллах боломжтой болох.
  2. Дата дээр ажиллаж эхлэх
    Датаг хуулбарлан авч Kaggle Kernels эсвэл бусад программуудыг ашиглан загвар байгуулан таамаглал бий болгох.
  3. Submission хийх
    Гарган авсан таамаглалаа Kaggle руу оруулан оноог тооцуулах.
  4. Leaderboard-г шалгах
    Өөрийн оруулсан submission-г бусад багуудтай харьцуулан байр эзлүүлсэн байгааг шалгах.
  5. Оноогоо сайжруулах
    Бусад тэмцээн, уралдаантай холбоотой зүйлсийг судлан өөрийн мэдлэгийг сайжруулснаар оноогоо шинэчлэн сайжруулах.

Тэмцээний тухай

Тэмцээнд 4 үндсэн файл өгөгдсөн буюу training.csvtraining.ziptest.zip гэсэн файлуудыг ашиглан таамаглал гарган авна. submission.csv файл нь Submission-г ямар форматаар хийхийг тайлбарласан файл буюу жинхэнэ утга биш гэдгийг анхаарна уу.

Та бүгдэд амжилт хүсье!

Тэмцээнийг шударга байлгах үүднээс та бүгд дүрмийг баримтлан оролцохыг хүсье.

ИВЭЭН ТЭТГЭГЧИД