Агаарын бохирдлын нарийн ширхэгт тоосонцор (PM2.5, PM10) гэж юу вэ?

Хүний үйл ажиллагааны үр дүнд болон байгалиас үүссэн агаар дахь хатуу тоосонцор, шингэн дуслыг нийтэд нь нарийн ширхэгт тоосонцор (Particulate matter-PM) гэдэг. Жишээлбэл тоос, тортог, хатуу, шингэн түлшний шаталтаас нарийн ширхэгт тоосонцор үүсдэг. Үүнийг диаметр буюу өргөнөөр нь РМ2.5 ба РМ10 гэх мэтчилэн ангилдаг. Агаарын найрлага дахь нарийн ширхэгт тоосонцрын хэмжээ ихсэж бохирдлын хэмжээнд хүрвэл амьсгалын замын өвчлөл үүсгэж, эрүүл мэндэд сөрөг нөлөө үзүүлдэг.

Агаарын бохирдол ба COVID:

Агаарт байгаа PM2.5 болон PM10 тоосонцор нь Ковид-19 вирусийн халдварын тархалтад болон эх, хүүхдийн эндэгдлийн тоонд мэдэгдэхүйц хэмжээнд нөлөөлж байгааг олон улсын судалгаа тогтоосоор байна. Тодруулбал агаарын бохирдол хүний биед нэвтэрснээр уушгийг гэмтээж, амьсгалын замын архаг өвчлөл (уушгины хорт хавдар, уушгины архаг өвчин, астма, уушгины үрэвсэл гэх мэт) -ийг үүсгэдэг. PM2.5 тоосонцор нь агаарт урт хугацааны туршид тогтож, хол нүүдэллэх чадвартай. Хэрэв Ковид-19 вирусийг өөртөө нэгтгэн барьцалдаж, цаашлан хүний уушги луу нэвтэрвэл архаг хууч өвчтэй өндөр настан болон эмзэг, сул эрхтэн тогтолцоотой хүүхэд, нялхас, эмэгтэйчүүдийн өвчинд нэрвэгдэх эрсдэлийг нэмэгдүүлэхээс гадна эдгээр өвчнийг улам даамжруулж, хүн амыг өвчинд илүү өртөмтгий болгох, цаашлаад хүнд хэлбэрт шилжих эрсдийг нэмэгдүүлнэ. Ялангуяа агаарын бохирдол нь үүсээд буй цар тахлын нөхцөл байдлыг улам хүндрүүлж болзошгүй.

Агаарын бохирдлыг хэмжих:

Улаанбаатар хотын хэмжээнд 13 ширхэг агаарын бохирдлыг хэмжих станц байгаагаас тэмцээнд 12-г нь өгсөн байгаа. Эдгээр станцууд нь цаг тутамд агаарын бохирдлын хэмжээг тодорхойлдог. Хүний биед хор нөлөөтэй агаарын тоосонцруудыг 1 метр куб агаарт байгаа PM2.5, PM10-уудын хэмжээг микрограммаар (μg/m3) тооцон хэмждэг.

Зорилго:

Тэмцээний зорилго нь тухайн станцуудын хувьд PM2.5 болон PM10 тоосонцруудын хэмжээг таамаглах чадвартай загвар байгуулах юм.

Загвар нь жилийг бүтнээр таамагладаг эсвэл өвлийн улирлыг таамагладаг загвар байх эсэх зэрэг өгөгдсөн асуудлыг шийдэх загварын цар хүрээг тэмцээнд оролцогч өөрөө тодорхойлно.

  • Тэмцээн эхлэх: 2020/11/24
  • Тэмцээний бүртгэл бөглөх эцсийн хугацаа: 2020/12/14
  • Баг үүсгэх эцсийн хугацаа: 2020/12/12 (энэ хугацаанаас хойш бүртгүүлсэн бол баг үүсгэхгүйгээр ганцаараа оролцож болно)
  • Тэмцээн дуусах: 2020/12/15, 23:59
  • Код болон шийдлээ явуулах хугацаа: 2020/12/16
  • Шалгарсан багуудад мэдэгдэх хугацаа: 2020/12/18
  • Код болон документ нь ямар нэг байдлаар бусдын ажлыг хуулбарласан, нууцын гэрээ, худалдааны гэрээ болон патенттай холбоотой байж болохгүй.
  • R эсвэл Python хэлний аль нэг дээр хийж болох ба хамгийн сайн submission-ы кодыг заавал Google colab notebook эсвэл Kaggle Kernel notebook байдлаар зохион байгуулагчид хүргүүлнэ.
  • Код нь заавал коммент, тайлбартай байна.
  • Шалгарсан шийдлийн документ нь хууль бус эсвэл ямар нэг хуулийг зөрчсөн мэдээлэл агуулж болохгүй.
  • Тэмцээнд оролцогч нь код болон документийн ашиглалттай холбоотойгоор зохион байгуулагчид болон спонсорууд-д ямар нэгэн байдлаар хуулийн хэрэг, зарга үүсгэхгүй гэдгийг баталж байгааг хүлээн зөвшөөрөв.
  • Тэмцээнд оролцогч болон багууд өөрсдийн шийдлийг олон нийтэд нээлттэй болгож болно.

Зорилго

Тэмцээний зорилго нь тухайн станцуудын хувьд PM2.5 болон PM10 тоосонцруудын хэмжээг таамаглах чадвартай загвар байгуулах юм.

Тэмцээний үнэлгээ

Тэмцээнийг RMSE (Root Mean Squared Error) – р байр эзлүүлнэ. RMSE -г таамагласан утга нь бодит утгаас зөрж буй зөрүүний квадратуудын нийлбэрээс квадрат дунджаас язгуур авч тооцдог. Томъёо:

Submission хийх файлын формат

Багууд submission файлаа csv форматаар оруулах бөгөөд тест датаны мөрийн тоотой (91’964) тэнцүү хэмжээний датаг оруулна. Дата нь Header буюу толгойтой submission хийгдэнэ. Хэрвээ илүү дутуу мөр, багана оруулбал алдаа заах тул доорх форматын дагуу зөв оруулна уу.

index, aqi

326131, 62

326132, 34

326133, 56

Шагналын сан: $1,600

  • 1-р байр: $800
  • 2-р байр: $500
  • 3-р байр: $300

ЕРӨНХИЙ ДҮРЭМ

Бүртгэл

  1. 1 оролцогч 1 Kaggle аккаунттай байна. Хэрэв баг бүрдүүлж орж байгаа бол багийн гишүүд тэмцээнд оролцохдоо олон аккаунтаас submission хийсэн тохиолдолд тэмцээнээс хасагдана.
  2. Тэмцээнд оролцогч бүр тэмцээний бүртгэлийн форм дээрх овог нэр, и-мэйл хаяг, утасны дугаар, kaggle profile, багийн нэр болон бусад мэдээллийг бүрэн бөглөж ирүүлнэ.

Оролцогчийн тоо

  1. Монгол болон гадаадад оршин сууж буй Монгол улсын иргэн тэмцээнд оролцох боломжтой.
  2. Тэмцээнд ганцаараа болон 3 хүртэлх хүний бүрэлдэхүүнтэй багаар оролцож болно.
  3. Нэг оролцогч зөвхөн нэг л багт харъяалагдана.
  4. Хэрэв баг бүрдүүлсэн бол баг бүр ахлагчтай, нэртэй байх ба Submission хийхдээ нэрээ оруулж, team merge хийсэн байна.

Үргэлжлэх хугацаа

  • Тэмцээн эхлэх: 2020/11/24
  • Тэмцээний бүртгэл бөглөх эцсийн хугацаа: 2020/12/14
  • Баг үүсгэх эцсийн хугацаа: 2020/12/12 (энэ хугацаанаас хойш бүртгүүлсэн бол баг үүсгэхгүйгээр ганцаараа оролцож болно)
  • Тэмцээн дуусах: 2020/12/15, 23:59
  • Код болон шийдлээ явуулах хугацаа: 2020/12/16
  • Шалгарсан багуудад мэдэгдэх хугацаа: 2020/12/18

Шагнал

Тэмцээний нийт шагналын сан $1’600

  • 1-р байр: $800
  • 2-р байр: $500
  • 3-р байр: $300

Нууцлал

  1. Kaggle discussion болон бусад мэдээлэл хуваалцах хэрэгслээр оролцогчид өөрийн багийн гишүүдээс бусад оролцогч нартай код болон шийдэлээ хуваалцахыг хориглоно.
  2. Өөрийн хийсэн даалгаврын шийдлийг Notebook/Kernel хэлбэрээр бусдад хуваалцахгүй байх.
  3. Өгөгдсөн дата мэдээллийг зүй бусаар ашиглан зохион байгуулагчид, спонсоруудын нэр хүндэд сөргөөр нөлөөлөхийг хориглоно.

Submission хийх хязгаар

  1. Нэг оролцогч/баг өдөрт 5 хүртэлх submission хийж болно.
  2. Тухайн оролцогч/багийн сонгосон 2 submission эцсийн байр эзлүүлэлтэд ашиглагдана.

Ашиглах компьютерийн хэл

  1. R эсвэл Python хэл дээр тэмцээний даалгаварыг хийж гүйцэтгэнэ.
  2. Бусад хэл дээр хийсэн тохиолдолд эдгээр хэл рүү хөрвүүлэхийг шаардана. Хэрэв боломжгүй бол кодыг хүлээн авахаас татгалзана.
  3. Тэмцээнд байр эзэлсэн оролцогч/ багуудыг Google Colab notebook болон Kaggle Kernel notebook-үүдийн аль нэг дээр бүрэн ажиллагаатай код ирүүлэхийг шаардана. Кодын шаардлагыг ТЭМЦЭЭНИЙ НАРИЙВЧИЛСАН ДҮРЭМ-н 3-р хэсгээс дэлгэрүүлэн уншина уу.

Байр эзлүүлэлт

  1. Нийт датаны 50% нь Leaderboard-д байршиж байгаа ба тухайн сонгогдсон 2 submission-г ашиглан Private Leaderboard –н оноогоор байр эзлэгдэнэ.
  2. Private Leaderboard-н топ 5 оролцогч/баг тэмцээний журамд заасан хугацаанд өөрсдийн код бүхий шийдлийг notebook хэлбэрээр зохион байгуулагчдад ирүүлнэ. Код нь reproducible байх шаардлагатай. (Хэрэв нэмэлтээр өгөгдөл ашигласан бол өгөгдлийг хамт илгээнэ)
  3. Кодын зөв эсэхийг шалган, ямар нэг зөрчилгүй оролцогч/багуудад тэмцээний эцсийн үр дүнг мэдэгдэнэ. Хэрэв шалгарсан оролцогч/багаас ямарваа нэгэн байдлаар тэмцээний журмыг зөрчсөн эсвэл шаардлага хангаагүй байдлаар хасагдах тохиолдолд дараагийн оролцогч/багт эзэлсэн байр шилжинэ.

Бусад

  1. Тэмцээний дүрмийн дагуу шударгаар өрсөлдөх
  2. Өөрөө оролцох
  3. Machine Learning UB Коммунитигийн дараах гишүүд тэмцээнд оролцох боломжгүй байх ба бусад гишүүд оролцож болно. Б. Билэгсайхан, С.Уянга, Ч. Алтан-Өлзий, Г. Чинзоригт, М. Амарсайхан, Т. Гэрэл, З. Тунгалаг
  4. Ивээн тэтгэгч байгууллагын дараах мэргэжилтнүүд тэмцээнд оролцох боломжгүй байна. Robert Ritz, Selection committee
  5. Тэмцээнтэй холбоотой онлайн, офлайн ямар нэг пост, мэдээлэл болон нийтлэлд Зохион байгуулагч, Спонсорууд, тэмцээнд оролцогчдыг доромжилсон, нэр хүндийг гутаасан, нас, хүйс, арьсны өнгө, шашин шүтлэг, ажил мэргэжлээр гадуурхсан болон дээрх этгээдүүдтэй холбоотой худал, хуурамч мэдээлэл тарааж болохгүй.

ТЭМЦЭЭНИЙ НАРИЙВЧИЛСАН ДҮРЭМ

Тэмцээний ерөнхий дүрмүүдээс гадна дараах нарийвчилсан дүрмүүд нь Спонсоруудын шаардлагаар тодорхойлогдож байна.

1. ЯЛАГЧИЙН ЛИЦЕНЗ

Ялагч болсон тохиолдолд дараах эрхийг зохион байгуулагчид олгохыг зөвшөөрөв:

“Тэмцээнд оролцсон эцсийн submission болон энэ submission-г гаргаж авахад ашигласан код, туслах материалыг ашиглах бүрэн эрхийг спонсор, зохион байгуулагчдад олгов. Үүнд зохион байгуулагчийн зүгээс код, туслах материалыг олон нийтэд нээлттэй болгохгүй ба спонсор, зохион байгуулагч нийгмийн эрүүл мэндийн зорилгоор ашиглана.”

2. ТЭМЦЭЭНД ОРОЛЦОГЧ

Тэмцээний ерөнхий дүрмийн Бусад: 3-т ороогүй Монгол улсын иргэн дараах этгээдүүд оролцох боломжтой. Үүнд:

А. Дата сайнс, дата анализ, бизнес анализ, статистикаар мэргэшин ажиллаж буй мэргэжилтнүүд, судлаачид

Б. Энэ чиглэлээр эрдмийн зэрэг горилж буй магистр, докторын оюутнууд, профессорууд

В. Дата өгөгдөл мэдээлэл дээр ажиллахаар сонирхон судлаж буй мэргэжилтнүүд, оюутан залуус

3. ШАЛГАРСАН БАГУУДЫН ШИЙДЛИЙН КОД БА ДОКУМЕНТ

Шалгарсан оролцогч/багууд код бүхий шийдлээ явуулахдаа дараах зааврыг мөрдөнө.

A. Код болон документ нь ямар нэг байдлаар бусдын ажлыг хуулбарласан, нууцын гэрээ, худалдааны гэрээ болон патенттай холбоотой байж болохгүй.

Б. R эсвэл Python хэлний аль нэг дээр хийж болох ба хамгийн сайн submission-ы код бүхий Google colab notebook эсвэл Kaggle Kernel notebook-г зохион байгуулагчид хүргүүлнэ.

В. Код нь заавал коммент, тайлбартай байна.

Г. Шалгарсан шийдлийн документ нь хууль бус эсвэл ямар нэг хуулийг зөрчсөн мэдээлэл агуулж болохгүй.

Д. Тэмцээнд оролцогч нь код болон документийн ашиглалттай холбоотойгоор зохион байгуулагчид болон спонсорууд-д ямар нэгэн байдлаар хуулийн хэрэг, зарга үүсгэхгүй гэдгийг баталж байгааг хүлээн зөвшөөрөв.

Е. Тэмцээнд оролцогч болон багууд өөрсдийн шийдлийг олон нийтэд нээлттэй болгож болно.

4. ТЭМЦЭЭНЭЭС ХАСАХ

Зохион байгуулагчид, Спонсорууд, Kaggle платформ нь тэмцээний ерөнхий болон нарийвчилсан дүрмүүдийн аль нэгийг зөрчсөн тохиолдолд тухайн баг, эсвэл гишүүний харъяалагдах багийг тэмцээнээс хасах бүрэн эрхтэй.

5. АВТОМАТ МАШИН СУРГАЛТЫН ПРОГРАМ (AUTOMATED MACHINE LEARNING TOOLS)

Энэ тэмцээнд ямар нэг автомат машин сургалтын програмыг ашиглахыг хориглох ба бүх код, документүүдийг тэмцээнд оролцогчид өөрсдөө бичсэн байна. Жишээлбэл: R, Python-ы sklearn, keras, tensorflow, pytorch гэх мэт загвар байгуулахтай холбоотой сангуудыг ашиглаж болно. Харин Cloud API болон төлбөртэй сангууд ашиглахгүй байх. Жишээлбэл Google Cloud Auto ML, TPOT, H2O.ai, DataRobot, BigML OptiML, Auto-WEKA гэх мэт.

6. ТЭМЦЭЭНИЙ ДАТА ӨГӨГДӨЛ

Тэмцээний дата өгөгдөлд тэмцээний вебсайт-д ил болгосон датаг оруулна. Тэмцээний дата нь сургалтын (training), нийтийн (public) болон хувийн (private) тестлэх дата агуулна.

A. Датаны ашиглалт: тэмцээний датаг дүрэмд заасны дагуу ашиглана.

Б. Датаны аюулгүй байдал: энэ дүрмийг хүлээн зөвшөөрснөөр та тэмцээний датаг бусдад хор хөнөөл учруулах зорилгоор болон хууль бусаар ашиглахгүй байхыг хувь хүний үүднээс чанд сахин мөрдөнө. Мөн ямар нэг байдлаар дээр дурьдсан үйлдлүүдийг бусад тэмцээнд оролцогчид үйлдсэнийг мэдвэл зохион байгуулагчид болон спонсоруудад мэдэгдэх үүрэгтэй.

В. Тэмцээнээс гадуурх дата: тэмцээний хүрээнд өгөгдсөн мэдээллээс гадна бусад төрлийн дата, өгөгдлийг (жишээлбэл: цаг агаарын нэмэлт өгөгдөл, хиймэл дагуулын зураг болон бусад төрлийн өгөгдөл) ашиглах боломжтой. Тэмцээнээс гадуурх дата нь олон нийтэд болон бусад оролцогчид нээлттэй болгож болох дата байна. Өөрөө дата бэлдсэн бол тухайн датаг олон нийтэд нээлттэй болгох эрхийг Machine Learning UB-д өгнө. Мөн тэмцээнээс гадуурх дата нь тэмцээний датаны хуулбар болон ижил төрлийн дата эсвэл шууд хамааралтай дата байхыг зөвшөөрөхгүй.

7. ЯЛАГЧИЙГ ТОДОРХОЙЛОХ

Submission-ууд нь үнэлгээний метрикийн дагуу ранклагдах ба тэмцээний хугацаанд Public Leaderboard нь оролцогчид харагдахаар байна. Тэмцээний ялагч нь зөвхөн private leaderboard-н ранкаар тодорхойлогдоно. Хэрэв багуудын оноо тэнцэн шалгаруулах багийн тооноос хэтэрвэл оноо тэнцсэн хамгийн түрүүнд submission хийсэн багийг тооцно.

8. ЯЛАГЧИЙГ ЗАРЛАХ

Тэмцээний ялагчид имэйл-р дамжуулан мэдээлэл хүргэнэ. Хэрэв хүргүүлсэн имэйл-д 3 хоногийн дотор хариу мэдэгдэхгүй бол дараагийн оролцогч/багийг ялагчаар сонгоно. Мөн ялагч нь тэмцээний дүрмийг зөрчсөн нь тогтоогдвол дараагийн оролцогч/багийг ялагчаар сонгоно. Ямар нэгэн байдлаар тэмцээний дүрмийг зөрчин тэмцээнд оролцох эрхгүй болсон оролцогч/багуудын оноог Leaderboard-с хасна.

9. ЯЛАГЧИЙН ҮҮРЭГ

Тэмцээний ялагч болсон тохиолдолд дараах үүргийг хүлээн биелүүлнэ. Үүнд:

(a) Тэмцээнд ашиглагдсан хамгийн сүүлийн код, програм, документийг хүргүүлэх. Эдгээр нь тэмцээний дүрэмд заасан шаардлагуудыг хангасан байх ба ялагч руу явуулсан заавар бүхий имэйлийн дагуу зохион байгуулагчдад хүргүүлнэ. Код нь эхнээсээ дуустал бүрэн ажиллах ёстой ба багууд кодын бүрэн ажиллагааг хариуцна. Хэрэв код ажиллаагүй тохиолдолд имэйлээр мэдээлэл хүргүүлэх бөгөөд имэйлд буй зааврын дагуу кодыг дахин ирүүлнэ.

(б) Тэмцээний шагналтай холбоотой баримт бичгүүдэд гарын үсэг зуран ирүүлэх үүрэгтэй.

10. ШАГНАЛ

Тэмцээний шагнал нь тэмцээний дүрэмд заагдсан байх ба тэмцээний дүрмийн шаардлагын дагуу шагналыг олгоно.

Тэмцээний ялагч нь шагналаас татгалзах эрхтэй ба энэ тохиолдолд зохион байгуулагчид тэр даруй мэдэгдэнэ.

Тэмцээний шагналыг шагналтай холбоотой баримт бичгүүдийг бүрэн хүлээн авснаас хойш 3 долоо хоногийн дотор олгоно.

Хэрэв багаар оролцсон тохиолдолд багийн ахлагч нь тэмцээний шагналыг шударгаар багийн гишүүдэд хуваарилан олгох үүрэгтэй.

11. ИНТЕРНЕТ

Тэмцээн нь онлайн платформ дээр зохион байгуулагдаж байгаа тул оролцогчид интернет орох боломжтой байна. Интернетийн ямар нэг тасалдал, алдаанаас болж тэмцээний эцсийн хугацаанаас хоцорсон бол зохион байгуулагч хариуцлага хүлээх болон эцсийн хугацааг сунгах боломжгүй.

12. ЗӨРЧЛИЙГ ШИЙДВЭРЛЭХ

Тэмцээнд оролцогчид тэмцээний ерөнхий болон нарийвчилсан дүрмүүдийг зөрчсөн бол зохион байгуулагчид, спонсорууд тэмцээний дүрэм, цаашлаад харъяалагдах хуулийн дагуу арга хэмжээ авах эрх

ИВЭЭН ТЭТГЭГЧИД