Сүүлийн жилүүдэд нийслэл Улаанбаатар хотын хүн ам болон автомашины тоо ихэссэнтэй холбоотой зам тээврийн олон төрлийн асуудал тулгарч эхэлсэн. Эдгээрийн нэг нь нийтийн тээврийн үйлчилгээ ба хүрэлцээтэй байдлын асуудал юм. Нийтийн тээврийн үйлчилгээг сайжруулах зорилгоор 2014 онд Нийслэлийн Засаг Дарга бөгөөд Улаанбаатар хотын захирагч болон НИТХ-ийн тэргүүлэгчдийн тогтооллоор Улаанбаатар Смарт Карт ХХК-г байгуулсан. Төслийн хүрээнд:

  • Нийтийн тээврийн удирдлагын систем /Bus management system/,
  • Тээврийн хэрэгслийн мэдээллийн систем /Bus information system/,
  • Цахим төлбөр тооцооны систем /Automated fare collection/-үүдийг хөгжүүлэн нутагшуулаад байна.
  • Төслийн хүрээнд иргэд U money картаар нийтийн тээврээр зорчих боломж бий болсон ба үүний үр дүнд маш их хэмжээний дата, өгөгдөл бий болдог.

Дэлхийн хөгжингүй улсуудад энэ төрлийн датаг ашиглан real-time систем бий болгосноор иргэдийн нийтийн тээврийн туршлагыг сайжруулах, иргэдэд зорчих аргаа төлөвлөх болон цаг хугацаа хэмнэх зэргээр иргэдийн амьдралд үнэ цэнэ нэмдэг.

Montreal based Transit APP

Тиймээс U money картын ашиглалтаас бий болж буй датаг ашиглах нь нийслэлийн нийтийн тээврийн үйлчилгээ төдийгүй хот төлөвлөлтөнд чухал ач холбогдолтой. Тэмцээний хүрээнд хиймэл оюун ухаан болон машин сургалтын загварыг ашиглан автобуснуудын дүүргэлт буюу тухайн буудалд нийт хэдэн хүн автобусанд байхыг таамаглах загвар гарган авах нь тэмцээний хоёрдугаар шатны асуудал болгон оруулж байна.

Kaggle тэмцээнд хэрхэн оролцдог вэ?
  1. Тэмцээнд нэгдэх буюу join хийх

    Тэмцээний тухай уншиж танилцах, дүрэмтэй танилцаж зөвшөөрөн дата өгөгдөл дээр ажиллах боломжтой болох.

  2. Дата дээр ажиллаж эхлэх

    Датаг хуулбарлан авч Kaggle Kernels эсвэл бусад программуудыг ашиглан загвар байгуулан таамаглал бий болгох.

  3. Submission хийх

    Гарган авсан таамаглалаа Kaggle руу оруулан оноог тооцуулах.

  4. Leaderboard-г шалгах

    Өөрийн оруулсан submission-г бусад багуудтай харьцуулан байр эзлүүлсэн байгааг шалгах.

  5. Оноогоо сайжруулах

    Бусад тэмцээн, уралдаантай холбоотой зүйлсийг судлан өөрийн мэдлэгийг сайжруулснаар оноогоо шинэчлэн сайжруулах.

Тэмцээний тухай

Тэмцээнд 4 үндсэн файл өгөгдсөн буюу training_phase2.csvtest_phase2.csvstops.csvroutes_phase2.csv гэсэн файлуудыг ашиглан таамаглал гарган авна. sample_submission.csv файл нь Submission-г ямар форматаар хийхийг тайлбарласан файл буюу жинхэнэ утга биш гэдгийг анхаарна уу.

Та бүгдэд амжилт хүсье!

Тэмцээнийг шударга байлгах үүднээс та бүгд дүрмийг баримтлан оролцохыг хүсье.

  • Тэмцээний эхлэх: 2020 оны 4-р сарын 8
  • Тэмцээний баг merge хийх хугацаа: 2020 оны 4-р сарын 13
  • Тэмцээн дуусах: 2020 оны 4-р сарын 15, 23:59 цаг
  • R эсвэл Python хэлний аль нэг дээр хийж болно
  • Шалгарсан багууд хамгийн сайн онооны Submission-г гаргаж авахад ашигласан кодыг зохион байгуулагчид хүргүүлсэн зааврын дагуу ирүүлнэ
  • Код нь коммент, тайлбартай байна

Зорилго

Тэмцээний 2-р шатанд оролцогчид машин сургалтын загвар ашиглан автобуснуудын дараагийн зогсоолд очиход хэдэн зорчигчтой байхыг таамаглах загвар гарган авах юм.

Таамаглах хувьсагч: GETON_CNT

Тэмцээний үнэлгээ

Тэмцээнийг MAE (Mean Absolute Error) – р байр эзлүүлнэ. MAE нь таамагласан утга нь бодит утгаас дунджаар хэдээр зөрж байгааг харуулна. Томъёо:

Submission хийх файлын формат

Багууд submission файлаа csv форматаар оруулах бөгөөд тест датаны мөрийн тоотой (1’560’665) тэнцүү хэмжээний датаг оруулна. Дата нь Header буюу толгойтой submission хийгдэнэ. Хэрвээ илүү дутуу мөр, багана оруулбал алдаа заах тул доорх форматын дагуу зөв оруулна уу.

index, GETON_CNT
3220254, 12
3220255, 12
гэх мэт.

Шагналын сан: 7 000 000₮

  • 1-р байр: 4 000 000₮
  • 2-р байр: 2 000 000₮
  • 3-р байр: 1 000 000₮

ЕРӨНХИЙ МЭДЭЭЛЭЛ

Баг

  1. 1 оролцогч 1 Kaggle аккаунттай байна. Багийн гишүүд тэмцээнд оролцохдоо олон аккаунтаас submission хийсэн тохиолдолд тэмцээнээс хасагдана.
  2. Тэмцээний 1-р шатанд орсон багаараа оролцох бөгөөд багийн гишүүн сольсон тохиолдолд тухайн баг тэмцээнээс хасагдана.
  3. Баг бүрдүүлээгүйгээр ганцаараа submission хийсэн бол тухайн оноог багийн оноо гэж тооцохгүй.

Үргэлжлэх хугацаа

  • Тэмцээн эхлэх: 2020/04/08
  • Тэмцээний журмыг зөвшөөрөх: 2020/04/12 (Энэ хугацаанаас өмнө тэмцээний журмыг зөвшөөрсөн байх)
  • Баг үүсгэх эцсийн хугацаа: 2020/04/13
  • Тэмцээн дуусах: 2020/04/15, 23:59
  • Код болон шийдлээ явуулах хугацаа: 2020/04/16
  • Тэмцээний үр дүнг мэдэгдэх хугацаа: 2020/04/16

Шагнал

  • 1-р байр: 4,000,000₮
  • 2-р байр: 2,000,000₮
  • 3-р байр: 1,000,000₮

Нууцлал

  1. Kaggle discussion болон бусад мэдээлэл хуваалцах хэрэгслээр оролцогчид өөрийн багийн гишүүдээс бусад оролцогч нартай код болон шийдэлээ хуваалцахыг хориглоно.
  2. Өөрийн хийсэн даалгаврын шийдлийг Notebook/Kernel хэлбэрээр бусдад хуваалцахгүй байх.
  3. Тэмцээний үеэр өгөгдсөн дата мэдээллийг зөвхөн тэмцээнд оролцох зорилгоор ашиглах, бусдад задруулахгүй байх.
  4. Өгөгдсөн дата мэдээллийг зүй бусаар ашиглан зохион байгуулагчид, спонсоруудын нэр хүндэд сөргөөр нөлөөлөхийг хориглоно.
  5. 4-р заалтыг зөрчсөн тохиолдолд датаг задруулсан болон зүй бусаар ашигласан этгээд хариуцлага хүлээнэ.

Submission хийх хязгаар

  1. Нэг баг өдөрт 5 хүртэлх submission хийж болно.
  2. Тухайн багийн сонгосон 2 submission эцсийн байр эзлүүлэлтэд ашиглагдана.

Ашиглах компьютерийн хэл

  1. R эсвэл Python хэл дээр тэмцээний даалгаварыг хийж гүйцэтгэнэ.
  2. Бусад хэл дээр хийсэн тохиолдолд эдгээр хэл рүү хөрвүүлэхийг шаардана. Хэрэв боломжгүй бол кодыг хүлээн авахаас татгалзана.

Байр эзлүүлэлт

  1. Нийт датаны 50% нь Leaderboard-д байршиж байгаа ба тухайн сонгогдсон 2 submission-г ашиглан Private Leaderboard –н топ 3 хүртэлх тооны баг шагналт байр эзэлнэ.
  2. Private Leaderboard-н тэмцээний журамд заасан хугацаанд өөрсдийн код бүхий шийдлийг notebook хэлбэрээр зохион байгуулагчдад ирүүлнэ. Код нь reproducible байх шаардлагатай. (Хэрэв нэмэлтээр өгөгдөл ашигласан бол өгөгдлийг хамт илгээнэ)
  3. Кодын зөв эсэхийг шалган, ямар нэг зөрчилгүй топ 3 багт заавар бүхий имэйл хүргэгдэнэ. Хэрэв топ 3 багаас ямарваа нэгэн байдлаар тэмцээний журмыг зөрчсөн эсвэл шаардлага хангаагүй байдлаар хасагдах тохиолдолд дараагийн багуудад шагналт байр шилжих болно.

Бусад

  1. Тэмцээний дүрмийн дагуу шударгаар өрсөлдөх
  2. Өөрөө оролцох
  3. Machine Learning UB Коммунитигийн гишүүд болон Улаанбаатар Смарт Карт байгууллагын ажилчид энэ тэмцээнд оролцох боломжгүй байна.
  4. Тэмцээнтэй холбоотой онлайн, офлайн ямар нэг пост, мэдээлэл болон нийтлэлд Зохион байгуулагч, Спонсорууд, тэмцээнд оролцогчдыг доромжилсон, нэр хүндийг гутаасан, нас, хүйс, арьсны өнгө, шашин шүтлэг, ажил мэргэжлээр гадуурхсан болон дээрх этгээдүүдтэй холбоотой худал, хуурамч мэдээлэл тараасан байж болохгүй.

ТЭМЦЭЭНИЙ НАРИЙВЧИЛСАН ДҮРЭМ

Тэмцээний ерөнхий дүрмүүдээс гадна дараах нарийвчилсан дүрмүүд нь Спонсоруудын шаардлагаар тодорхойлогдож байгаа.

1. ЯЛАГЧИЙН ЛИЦЕНЗ

Ялагч болсон тохиолдолд дараах эрхийг зохион байгуулагчид олгохыг зөвшөөрөв:

” Тэмцээнд оролцсон эцсийн submission болон энэ submission-г гаргаж авахад ашигласан код, туслах материалыг ашиглах бүрэн эрхийг олгов.”

2. ТЭМЦЭЭНД ОРОЛЦОГЧ

Тэмцээний ерөнхий дүрмийн Бусад: 3-т ороогүй Монголд ажиллаж, амьдардаг, Монгол улсын иргэн дараах этгээдүүд оролцох боломжтой. Үүнд:

А. Дата сайнс, дата анализ, бизнес анализ, статистикаар мэргэшин ажиллаж буй мэргэжилтнүүд, судлаачид

Б. Энэ чиглэлээр эрдмийн зэрэг горилж буй магистр, докторын оюутнууд, профессорууд

В. Дата өгөгдөл мэдээлэл дээр ажиллахаар сонирхон судлаж буй мэргэжилтнүүд, оюутан залуус

3. ШАЛГАРСАН БАГУУДЫН ШИЙДЛИЙН КОД БА ДОКУМЕНТ

Шалгарсан багууд код бүхий шийдлээ явуулахдаа дараах зааврыг мөрдөнө.

A. Код болон документ нь ямар нэг байдлаар бусдын ажлыг хуулбарласан, нууцын гэрээ, худалдааны гэрээ болон патенттай холбоотой байж болохгүй.

Б. R эсвэл Python хэлний аль нэг дээр хийж болох ба хамгийн сайн submission-ы код бүхий notebook эсвэл Kaggle Kernel notebook-г зохион байгуулагчид хүргүүлнэ.

В. Код нь заавал коммент, тайлбартай байна.

Г. Шалгарсан шийдлийн документ нь хууль бус эсвэл ямар нэг хуулийг зөрчсөн мэдээлэл агуулж болохгүй.

Д. Тэмцээнд оролцогч нь код болон документийн ашиглалттай холбоотойгоор зохион байгуулагчид болон спонсорууд-д ямар нэгэн байдлаар хуулийн хэрэг, зарга үүсгэхгүй гэдгийг баталж байгааг хүлээн зөвшөөрөв.

4. ТЭМЦЭЭНЭЭС ХАСАХ

Зохион байгуулагчид, Спонсорууд, Kaggle платформ нь тэмцээний ерөнхий болон нарийвчилсан дүрмүүдийн аль нэгийг зөрчсөн тохиолдолд тухайн баг, эсвэл гишүүний харъяалагдах багийг тэмцээнээс хасах бүрэн эрхтэй.

5. АВТОМАТ МАШИН СУРГАЛТЫН ПРОГРАМ (AUTOMATED MACHINE LEARNING TOOLS)

Энэ тэмцээнд ямар нэг автомат машин сургалтын програмыг ашиглахыг хориглох ба бүх код, документүүдийг тэмцээнд оролцогчид өөрсдөө бичсэн байна. Жишээлбэл: R, Python-ы sklearn, keras, tensorflow, pytorch гэх мэт загвар байгуулахтай холбоотой сангуудыг ашиглаж болно. Харин Cloud API болон төлбөртэй сангууд ашиглахгүй байх. Жишээлбэл Google Cloud Auto ML, TPOT, H2O.ai, DataRobot, BigML OptiML, Auto-WEKA гэх мэт.

6. ТЭМЦЭЭНИЙ ДАТА ӨГӨГДӨЛ

Тэмцээний дата өгөгдөлд тэмцээний вебсайт-д ил болгосон датаг оруулна. Тэмцээний дата нь сургалтын (training), нийтийн (public) болон хувийн (private) тестлэх дата агуулна.

A. Датаны ашиглалт: тэмцээний датаг дүрэмд заасны дагуу ашиглана.

Б. Датаны аюулгүй байдал: энэ дүрмийг хүлээн зөвшөөрснөөр та тэмцээний датаг хувилахгүй, бусдад тараахгүй, зөвшөөрөлгүйгээр олон нийтэд дэлгэхгүй болон зүй бусаар ашиглахгүй байхыг хувь хүний үүднээс чанд сахин мөрдөнө. Мөн ямар нэг байдлаар дээр дурьдсан үйлдлүүдийг бусад тэмцээнд оролцогчид үйлдсэнийг мэдвэл зохион байгуулагчид болон спонсоруудад мэдэгдэх үүрэгтэй.

В. Тэмцээнээс гадуурх дата: тэмцээний хүрээнд өгөгдсөн мэдээллээс гадна бусад төрлийн дата, өгөгдлийг ашиглах боломжтой. Тэмцээнээс гадуурх дата нь олон нийтэд болон бусад оролцогчид нээлттэй болгож болох дата байна. Мөн тэмцээнээс гадуурх дата нь тэмцээний датаны хуулбар эсвэл ижил төрлийн, өмнөх хугацааны дата өгөдөл байхыг зөвшөөрөхгүй.

7. ЯЛАГЧИЙГ ТОДОРХОЙЛОХ

Submission-ууд нь үнэлгээний метрикийн дагуу ранклагдах ба тэмцээний хугацаанд Public Leaderboard нь оролцогчид харагдахаар байна. Тэмцээний ялагч нь зөвхөн private leaderboard-н ранкаар тодорхойлогдоно. Хэрэв багуудын оноо тэнцэн шалгаруулах багийн тооноос хэтэрвэл оноо тэнцсэн хамгийн түрүүнд submission хийсэн багийг сонгоно.

8. ЯЛАГЧИЙГ ЗАРЛАХ

Тэмцээний ялагчид имэйл-р дамжуулан мэдээлэл хүргэнэ. Хэрэв хүргүүлсэн имэйл-д 1 хоногийн дотор хариу мэдэгдэхгүй бол дараагийн багийг ялагчаар сонгоно. Мөн ялагч нь тэмцээний дүрмийг зөрчсөн нь тогтоогдвол дараагийн багийг ялагчаар сонгоно.

Ямар нэгэн байдлаар тэмцээний дүрмийг зөрчин тэмцээнд оролцох эрхгүй болсон багуудын оноог Leaderboard-с хасна.

9. ЯЛАГЧИЙН ҮҮРЭГ

Тэмцээний ялагч болсон тохиолдолд дараах үүргийг хүлээн биелүүлнэ. Үүнд:

(a) Тэмцээнд ашиглагдсан хамгийн сүүлийн код, програм, документийг хүргүүлэх. Эдгээр нь тэмцээний дүрэмд заасан шаардлагуудыг хангасан байх ба ялагч руу явуулсан заавар бүхий имэйлийн дагуу зохион байгуулагчдад хүргүүлнэ. Код нь эхнээсээ дуустал бүрэн ажиллах ёстой ба багууд кодын бүрэн ажиллагааг хариуцна. Хэрэв код ажиллаагүй тохиолдолд имэйлээр мэдээлэл хүргүүлэх ба имэйлд буй зааврын дагуу кодыг дахин ирүүлнэ.

(б) Тэмцээний шагналтай холбоотой баримт бичгүүдэд гарын үсэг зуран ирүүлэх үүрэгтэй.

10. ШАГНАЛ

Тэмцээний шагнал нь тэмцээний дүрэмд заагдсан байх ба тэмцээний дүрмийн шаардлагын дагуу шагналыг олгоно.

Тэмцээний ялагч нь шагналаас татгалзах эрхтэй ба энэ тохиолдолд зохион байгуулагчид тэр даруй мэдэгдэнэ.

Тэмцээний шагналыг шагналтай холбоотой баримт бичгүүдийг бүрэн хүлээн авснаас хойш 3 долоо хоногийн дотор олгоно.

Багийн ахлагч нь тэмцээний шагналыг шударгаар багийн гишүүдэд хуваарилан олгох үүрэгтэй.

11. ИНТЕРНЕТ

Тэмцээн нь онлайн платформ дээр зохион байгуулагдаж байгаа тул оролцогчид интернет орох боломжтой байна. Интернетийн ямар нэг тасалдал, алдаанаас болж тэмцээний эцсийн хугацаанаас хоцорсон бол зохион байгуулагч хариуцлага хүлээх болон эцсийн хугацааг сунгах боломжгүй.

12. ЗӨРЧЛИЙГ ШИЙДВЭРЛЭХ

Тэмцээнд оролцогчид тэмцээний ерөнхий болон нарийвчилсан дүрмүүдийг зөрчсөн бол зохион байгуулагчид, спонсорууд тэмцээний дүрэм, цаашлаад харъяалагдах хуулийн дагуу арга хэмжээ авах эрхтэй.

ИВЭЭН ТЭТГЭГЧИД