17

บันทึกสรุปงาน NECTEC ACE 2016

Print Friendly

ภายในห้านาทีแรกของการกล่าวเปิดงาน ศ.ดร.ไพรัช ธัชยพงษ์ อดีตผู้อำนวยการ NECTEC และอดีตผู้อำนวยการ สวทช. ได้กล่าวถึง core values ที่ทำให้ NECTEC ประสบความสำเร็จคือ

  1. ความซื่อสัตย์สุจริต: ใน สวทช. ไม่เคยมี scandal
  2. “เราไม่แย่งกันเป็นเบอร์หนึ่ง”: เมื่อใดที่องค์กรแย่งกันเป็นเบอร์หนึ่ง เมื่อนั้นจะใช้ทรัพยากรในทางที่ผิด

จากนั้นท่านได้เอ่ยชื่อบุคคลสำคัญ ผู้ซึ่งทาบทามให้ท่านมาร่วมก่อตั้ง NECTEC นั่นคือ ดร. กฤษณพงศ์ กีรติกร

ผมจึงได้ทราบว่าคนของ มจธ. นี่เองที่เป็นผู้ให้กำเนิดสถาบันที่สร้างสรรค์เทคโนโลยีที่เป็นประโยชน์กับประเทศมายาวนนานถึง 30 ปี มีผลิตภัณฑ์ที่ใช้ได้จริงหลายเรื่อง เรื่องที่ผมตั้งใจมาศึกษาในวันนี้คือ

  1. เทคโนโลยีภาษาไทย เช่น Lexitron, LexTo, S-Sense และการแข่งขันเกี่ยวกับเทคโนโลยีภาษาไทย (BEST)
  2. Big Data และ Open Data in Government

de2770al314319

ความสำคัญต่อ LI

(ส่ิงที่กล่าวในหัวข้อนี้ น่าจะเป็นจริงสำหรับหน่วยงานอื่นๆ/มหาวิทยาลัยอื่นๆ เช่นเดียวกัน)

  1. bottleneck สำคัญของการนำเทคโนโลยีมาใช้ในหลายๆ เรื่อง ที่เกี่ยวข้องกับ LI คือความสามารถในการประมวลผลภาษาไทย ถ้าเราสามารถนำเทคโนโลยีที่พัฒนาโดย NECTEC มาใช้ร่วมกับ open source solutions จากแหล่งอื่นได้ เราจะสามารถทุ่มเท developer resource ของหน่วยงานให้กับการพัฒนาเทคโนโลยีส่วนที่สำคัญจริงๆ ที่ มจธ. สามารถนำมาใช้งานได้ทันที โดยไม่ต้องเสียเวลาทำซ้ำ (reinventing the wheels) นอกจากนี้ความสามารถทางการประมวลผลภาษาไทยยังจะเป็น competitive advantage ที่สำคัญ เพราะข้อจำกัดนี้มีอยู่ในทุกองค์กรในประเทศไทย ถ้าเราสามารถสร้างความร่วมมือกับ NECTEC เพื่อ address ข้อจำกัดนี้ได้ แม้เพียงบางส่วน เราจะอยู่ใน position ที่สามารถสร้างสรรค์ส่ิงที่มีประโยชน์อย่างโดดเด่นเพื่อคนไทยได้ อาทิ
    • KM: การตัดคำที่ดีขึ้น จะทำให้เราสามารถวิเคราะห์และ visualize เนื้อหาและ topic ต่างๆ ได้ (เช่นการใช้ word cloud, word tree)
    • Curriculum Dashboard: การตัดคำได้จะทำให้เราวิเคราห์ และสร้างระบบช่วยเหลืออาจารย์ในการเขียน learning outcome ได้ดีขึ้น
    • Peer Assessment: ความสามารถในการวิเคราะห์ความคิดเห็น (เช่น แง่บวกหรือแง่ลบ) จะทำให้ระบบสามารถสร้างประโยชน์จาก comment ที่เป็นข้อความได้ง่ายขึ้น เช่นอาจช่วยกรองความคิดเห็นเพื่อจัดระเบียบก่อนส่งคืนให้เจ้าของงาน
  2. เราจำเป็นต้องทราบสถานการณ์ของเทคโนโลยีด้าน big data และการนำเทคโนโลยีมาใช้ในหน่วยงานอื่นๆ เพื่อจะได้ทราบถึงข้อดีข้อเสียและข้อควรระวังของเครื่องมือ แนวทางปฏิบัติ และเทคนิคต่างๆ ข้อมูลส่วนนี้มีความเกี่ยวเนื่องโดยตรงกับการพัฒนา curriculum dashboard

wq61973y1901n8 4e83654z2545vj


เทคโนโลยีทางภาษา

x29601087243nx

ผมได้เข้าฟังการเสวนาในช่วงเช้า และได้เดินชมนิทรรศการในช่วงเย็น มีประเด็นที่น่าสนใจดังนี้

Lexitron คืออะไร?

Lexitron คือพจนานุกรมไทย-อังกฤษ ที่ NECTEC สร้างขึ้นมาตั้งแต่ปี 2537 จนถึงปัจจุบันก็อายุ 20 กว่าปีแล้ว มีข้อดีและข้อจำกัดดังนี้:

  • ส่วนที่เปิดให้ใช้ฟรี: การค้นหาคำศัพท์ออนไลน์
    • เข้าใช้ทาง http://lexitron.nectec.or.th/ (คำเตือน: โหลดช้ามาก, มี pop-up ขอให้ทำ survey, มี server error)
    • เข้าใช้ทาง https://dict.longdo.com/ แล้วระบบจะไปค้นหาในฐานข้อมูลของ Lexitron ร่วมกับแหล่งอื่นๆ ให้เอง
  • ส่วนที่ไม่แน่ใจว่าใช้ยังไง: โปรแกรม dictionary บนคอมพิวเตอร์ และ smartphone app
    • จะต้องลงทะเบียนก่อน download
    • ระบบลงทะเบียนใช้งานค่อนข้างยาก
  • ส่วนที่ไม่ฟรี: database, การนำไปใช้ใน application อื่นๆ
การนำ Lexitron ไปใช้
  • ติดต่อฝ่ายพัฒนาธุรกิจและถ่ายทอดเทคโนโลยี (BTT) ของ NECTEC
  • คนที่นำ Lexitron ไปใช้แล้ว เช่น Sanook, Kapook, Longdo, ราชบัณฑิตยสภา, กรมหม่อนไหม

screenshot-2016-09-19-08-51-30

ดร. ภัทระ เกียรติเสวี (General Manager ของ Longdo.com)

ผมตื่นเต้นมากที่พบกับท่าน เพราะว่าเป็นผู้ที่ใช้ประโยชน์จาก dict.longdo.com มานาน ตอนจบงานจึงเข้าไปแนะนำตัวและกล่าวขอบคุณ ท่านก็ใจดีมอบนามบัตรมาให้ด้วย

ดร. ภัทระ เคยทำงานที่ NECTEC มาก่อน จากนั้นลาออกไปตั้งบริษัท เมตามีเดีย เทคโนโลยี (www.mm.co.th) มี product สำคัญก็คือ longdo dict, map, traffic และเป็นตัวแทนจำหน่ายซอฟท์แวร์ pentaho

ดร. ภัทระ เสนอ model การทำงานร่วมกันเป็นทีมระหว่างภาครัฐและภาคเอกชน ดังนี้

  • ภาครัฐควร focus กับการทำในสิ่งที่เอกชนทำเองไม่ได้ เช่นการสร้าง Lexitron dictionary
  • จากนั้นควรเปิดโอกาสให้เอกชนเข้ามาช่วยเผยแพร่
    • เอกชนสามารถช่วยพัฒนา website, applications ให้ได้ รัฐไม่จำเป็นต้องทำเอง
    • ปัจจุบัน KPI ของ NECTEC คือการนับจำนวน applications ดังนั้นคนใน NECTEC จึงต้องสร้าง app จำนวนมาก
    • ถ้าสามารถเปลี่ยน KPI ให้นับจำนวน app ของเอกชนที่นำข้อมูล lexitron ไปใช้ได้ด้วย จะทำให้สามารถแบ่งงานกันได้ดีขึ้น
  • รัฐควรเปิดเผยข้อมูลให้เป็น open data อย่างแท้จริง
    • รัฐควรทบทวนนโยบายที่ห้ามนำข้อมูลไปใช้ในเชิงการค้า เพราะจะทำให้เอกชนนำไปต่อยอดไม่ได้
    • คำว่า non-commercial เป็นของแสลงของเอกชน
  • เราสามารถมองงานวิจัยได้ในโมเดลของ iOS versus Android
    • iOS สวยงาม หรูหรา ใช้ง่าย ขายแพง
      • งานวิจัยแบบที่ทำเสร็จแล้วแบบสำเร็จรูป สามารถขายสู้บริษัทเอกชนต่างชาติได้ ก็ควรรีบขาย ตั้งราคาให้เหมะสมเพื่อให้เทคโนโลยีเผยแพร่ได้และได้กำไร
    • Android: แจกฟรี เปิดเผยให้ใครใช้ก็ได้
      • งานวิจัยที่มีประโยชน์ แต่ยังไม่มี package ที่พร้อมต่อการขาย (ยังขายไม่ได้) ก็ควรจะรีบเผยแพร่ออกไปโดยเร็วโดยการแจกฟรีแบบ open source, open data เพื่อให้ภาคเอกชนนำไปต่อยอด และก่อให้เกิดประโยชน์ในวงกว้างได้

คุณปรเมศวร์ มินศิริ (sanook.com, kapook.com)

ผมได้ยินชื่อเสียงคุณปรเมศวร์ มินศิริ มานาน วันนี้เพิ่งจะได้เจอตัวจริง เขาดูเป็นคนที่สนใจใฝ่เรียนรู้ และพยายามแสวงหา intersection of interests ระหว่างหน่วยงานต่างๆ โดยเฉพาะในด้านความร่วมมือระหว่างภาครัฐและเอกชนที่สอดคล้องกับแนวคิดของ ดร. ภัทระ

ประเด็นความคิดเห็นที่น่าสนใจมีดังนี้:

  1. สิ่งที่รัฐบาลควรทำคือสิ่งที่ทำได้ยากโดยเอกชน และสิ่งที่ชาวต่างชาติคงจะไม่ทำ โดยเอกชนยินดีจ่ายสตางค์สนับสนุนเพื่อนำไปใช้งาน
  2. เราไม่ควรรอให้ทุกอย่าง perfect ก่อนที่จะปล่อยข้อมูลออกสู่สาธารณะ
    • expert ผู้ที่ทำหน้าที่เป็น gatekeepers ควรมุ่งเป้าที่การเผยแพร่ มากกว่าความถูกต้อง 100%
    • ปล่อยให้ประชาชน และภาคเอกชน ช่วยกันจัดระเบียบและตรวจสอบความถูกต้องของข้อมูลเอง
    • ตัวอย่าง: ข้อมูลจากราชบัณฑิตยสภา
  3. เครื่องมือทางภาษาที่ไทยควรมีคือ
    • font แห่งชาติ
    • แหล่งเรียนรู้ภาษาสำหรับชาวต่างชาติ เช่นประเทศจีนมีเครื่องมือนี้ ทำให้คนทั่วโลกเรียนภาษาจีนได้ง่ายมาก ในขณะที่ภาษาลาวมี reference น้อย หาได้ยาก

ดร. ชลธิชา สุดมุข (ราชบัณฑิตยสภา)

ดร. ชลธิชา เล่าเรื่องราวการย้ายสำนักงานของราชบัณฑิตยสภาได้อย่างน่าสนุกตื่นเต้น และได้เล่าถึงตู้เอกสารที่ชื่อว่า “ตู้ชื่นใจ” ซึ่งเป็นการเก็บรวบรวมข้อมูลโดยละเอียดเกี่ยวกับการสร้างพจนานุกรม ไม่เพียงแค่คำศัพท์และความหมาย แต่ยังรวมถึงข้อมูลอ้างอิง บันทึกความคิดเห็นในที่ประชุมสำหรับคำศัพท์แต่ละคำ

ข้อมูลเหล่านี้แม้จะมีการกรอกลงในคอมพิวเตอร์แล้ว แต่ความซับซ้อนของข้อมูลมีสูงมาก การจัดระเบียบทำได้ยาก จึงต้องขอความช่วยเหลือจาก NECTEC ให้ช่วยจัดการข้อมูล ทั้งในด้านการจัดเก็บ การจัดระเบียบ และการเผยแพร่

นอกเหนือจากข้อมูลพจนานุกรม สิ่งที่ราชบัณฑิตสนใจก็เช่น

  1. การอนุรักษ์ข้อมูลภาษาถิ่น ระบบการออกเสียง ระบบการเขียน ซึ่งเป็นเรื่องน่าเป็นห่วงว่าภาษาถิ่นหลายภาษากำลังจะหายไปเพราะมีจำนวนผู้ใช้ภาษาน้อยลง
  2. เกณฑ์มาตรฐานภาษาไทย สำหรับการวัดความสามารถผู้เรียนภาษาไทย โดยเฉพาะชาวต่างชาติ โครงการนี้กำลังดำเนินการ คาดว่าจะแล้วเสร็จในปี 2560

ดร. วีระแมน นิยมพล (มหาวิทยาลัยมหิดล)

ดร. วีระแมน ให้ความคิดเห็นเกี่ยวกับ inclusive society และ assistive technology ที่น่าสนใจ และสอดคล้องกับหลักการ Universal Design ของ Ronald Mace

  1. ท่านเคยใช้ Lexitron เวอร์ชั่น สำหรับคนตาบอด และรู้สึกชื่นชม
  2. ท่านชื่นชม Apple iPhone ที่มาพร้อมกับเทคโนโลยีเพื่อคนตาบอด ที่ใช้งานได้ง่าย และใช้ร่วมกับ content ต่างๆ ได้ดี
  3. ท่านเสนอว่า ในรุ่นต่อไปของ software ต่างๆ ผู้จัดทำไม่จำเป็นต้องทำเวอร์ชั่นสำหรับคนตาบอดก็ได้ เพียงแต่ทำให้ software อยู่บน web ที่เป็นมาตรฐาน แล้วคนตาบอดสามารถใช้ screen reader อ่านได้เอง
  4. ไม่มีความจำเป็นที่เราจะต้องสร้าง speech synthesis เอง เพราะระบบต่างๆ เหล่านี้มีอยู่แล้ว
  5. ผู้พัฒนาซอฟท์แวร์ไม่ควรแยก version สำหรับคนตาบอดและคนธรรมดา
    • ควรสร้างซอฟท์แวร์ที่คนทุกคนใช้งานได้ตั้งแต่แรก
    • เวลาที่ต้องอัพเดต: ถ้ามี 2 versions มักจะไม่สามารถอัพเดตได้พร้อมกัน
  6. ในอดีตเราใส่ใจกับการทำลายกำแพงทางกายภาพ (physical barrier) ในปัจจุบันเราต้องทำลายกำแพงทางข้อมูลข่าวสาร (information barrier)
  7. เทคโนโลยีที่ทำให้คนพิการได้ประโยชน์ จะทำให้คนอื่นๆ ทุกคนได้ประโยชน์ไปด้วย
    • เช่น การพัฒนาโปรแกรมแปลข้อความเป็นอักษร Braille ช่วยส่งเสริมงานวิจัยทางด้านการตัดคำ

คุณศิริพร บุญชู (กรมหม่อนไหม)

กรมหม่อนไหมได้ทำงานกับ NECTEC มาแล้ว 3 ปี เพื่อพัฒนาพจนานุกรมศัพท์เฉพาะทาง

คุณศิริพรเปรียบเทียบ Lexitron ว่าเหมือนกับธนาคารพันธุ์ไหม ในแง่ที่ว่าผู้ใช้บริการสามารถหาความรู้เรื่องหม่อนไหมได้ และสามารถคนหาคำคล้าย คำเหมือน คำที่เขียนได้หลายรูปแบบได้

นอกจากนี้คุณศิริพรยังกล่าวถึงฐานความรู้เกี่ยวกับการสาวไหม ซึ่งผมฟังดูแล้วรู้สึกว่า Lexitron กำลังถูกมองว่ามีหน้าที่เกินกว่าเพียงแค่พจนานุกรม แต่เป็นเสมือน knowledge management (KM) หรือ online learning resource (OLR) ซึ่งเป็นเรื่องน่าคิดว่าควรจะออกแบบรวมกันหรือแยกส่วน

เอสเซนส์ (S-SENSE)

ในช่วงเย็นระหว่างเดินชทนิทรรศการ ผมได้สะดุดตากับบูธหนึ่งซึ่งมีหน้าจอคอมพิวเตอร์แสดง tweets จากบุคคลต่างๆ และมี icon กำกับว่าผู้เขียนน่าจะมีความรู้สึกอย่างไร ผมจึงเข้าไปพูดคุยกับผู้นำเสนอ (คุณกนกพร ซึ่งมากับทีม ดร. ชูชาติ ) เพราะเห็นว่าความสามารถในการวิเคราะห์อารมณ์ผ่านข้อความภาษาไทยนี้น่าจะมีประโยชน์กับการจัดการความรู้ (KM) และการวิเคราะห์ feedback จากผู้เรียน (ในการวิเคราะห์ exit ticket และการทำ peer assessment)

7p3870ig2315io

S-SENSE ย่อมาจาก Social Sensing เป็นระบบที่วิเคราะห์ว่าความคิดเห็นใน social media นั้น เป็นไปในทางบวกหรือทางลบ หรืออาจเรียกเป็นภาษาวิชาการว่า sentiment analysis (บางที่เรียก opinion mining) ซึ่งระบบเช่นนี้มีใช้อยู่ทั่วไปในเว็บระดับโลกอย่าง Amazon, Yelp, Facebook ซึ่งโฟกัสกับภาษาอังกฤษ เท่าที่ผมทราบยังไม่มีระบบอื่นใดที่ทำงานได้กับภาษาไทย (ถ้ามีระบบอื่นที่ผมไม่ทราบ รบกวนแนะนำผมด้วยครับ)

ปัจจุบัน S-SENSE อยู่ใน version ที่ 2 ซึ่งสามารถวิเคราะห์ประโยคซับซ้อนได้ สามารถเข้าใจประโยคเปรียบเทียบผลิตภัณฑ์สองชนิดได้ สามารถเข้าใจจุดประสงค์ของประโยคได้ว่าเป็นการร้องขอ การสอบถาม การโฆษณา หรือการแสดงความเห็น

u06022iy66705q

หน่วยงานที่เกี่ยวข้อง:

เรื่องที่เกี่ยวข้อง
  1. POP เป็น application ตัวอย่างที่ใช้ S-SENSE: http://pop.ssense.in.th/
    (ท่านผู้อ่านลองเล่นดูสิครับ เรากรอก keyword เองได้ด้วยนะ สนุกดี)screenshot-2016-09-19-12-38-09
  2. ระบบ Eureka ที่ช่วยใช้จัดหมวดหมู่ข้อความในเว็บ Pantip
    • ไม่แน่ใจว่าเกี่ยวข้องกับ auto tag จาก ม.เกษตรฯ หรือไม่: http://eureka.bangkokbiznews.com/detail/634048
  3. ตัวอย่างลูกค้าของ S-SENSE ในปัจจุบัน: บริษัท Social Enable, Tell Voice ให้บริการ social media monitoring กับลูกค้า
  4. S-SENSE ใช้โปรแกรมตัดคำ Lexto http://www.sansarn.com/lexto/ ซึ่งสามารถทำหนังสือขอใช้งานได้เช่นกัน
  5. การใช้งาน S-SESE และ Lexto ผ่าน API อาจมี limit อยู่ที่ประมาณ 5000 ครั้งต่อวัน (ไม่แน่ใจสำหรับตัวเลข)

Big Data and Open Data in Government

การสัมนาในช่วงบ่ายเป็นการรวม 2 เรื่องเข้าด้วยกัน คือ open data และ big data ในบริบทของข้อมูลจากหน่วยงานภาครัฐ เท่าที่ฟังดูก็พบว่าสถานการณ์ open data หรือการเปิดเผยข้อมูลภาครัฐ ของไทยเรายังอยู่ใน eary stage มากๆ แต่ก็พอมี success stories เป็นตัวอย่างอยู่บ้าง

ดร. ศักดิ์ เสกขุนทด ผู้อำนวยการ สรอ. ให้เครดิตต่อแนวคิด open data กับประธานาธิบดี Obama ที่จัดตั้ง data.gov เป็นแรงบันดาลใจให้ประเทศไทย จัดทำ https://data.go.th เพื่อเผยแพร่ข้อมูลต่างๆ โดยในยุคแรก เรากำลังมีอุทกภัยครั้งใหญ่ กทม. จึงได้เปิดเผยข้อมูลระดับน้ำที่ประตูน้ำต่างๆ ทำให้เอกชนสามารถหยิบข้อมูลไปใช้เพื่อการวิเคราะห์เพิ่มเติม และการสื่อสารกับประชาชนได้

หลักการพื้นฐาน

เป้าหมายของการทำ open data

  1. ความโปร่งใส (transparency)
  2. ความมีส่วนร่วม (participation)
  3. ความร่วมมือ (collaboration)

ลักษณะสำคัญของข้อมูลที่มีประโยชน์สูงสุด

  1. machine processible: อยู่ในรูปแบบที่คอมพิวเตอร์อ่านได้ง่าย
    • หลีกเลี่ยง pdf
    • ควรเป็น excel spreadsheet, csv
    • ที่ดีกว่านั้นคือเป็น API สามารถติดต่อผ่านโปรแกรมได้
  2. non discriminatory: ทุกคนเข้าถึงได้ ไม่เลือกที่รักมักที่ชัง
  3. non proprietary: ไม่ยึดติดกับหน่วยงานหรือบริษัทใดบริษัทหนึ่ง มีรูปแบบที่เป็นมาตรฐาน ไม่จำเป็นต้องใช้ซอฟท์แวรพิเศษในการอ่าน
  4. license-free: นำไปใช้ได้ทันทีโดยไม่ต้องขออนุญาต

หน่วยงานที่เกี่ยวข้อง

  1. สำนักงานรัฐบาลอิเล็กทรอนิกส์ (สรอ.)  https://www.ega.or.th
  2. ระบบการจัดซื้อจัดจ้างภาครัฐ http://gprocurement.go.th
    • การจ่ายเงิน: ปัจจุบันรัฐสามารถจ่ายผู้ค้าได้โดยตรง
    • เดี๋ยวนี้ไม่ต้องซื้อซองประกวดราคาแล้ว (การซื้อซอง และการเดินไปยื่นซอง ทำให้ผู้ประกวดราคารู้ว่ามีใครเป็นคู่แข่งบ้าง ทำให้สามารถฮั้วกันได้)
    • รายชื่อผู้ประกวดราคาจะเปิดเผยหลังจากทำสัญญาเสร็จแล้วเท่านั้น
    • ประชาชนได้ประโยชน์: ทำให้ทราบว่า ภาษีไปไหน? https://govspending.data.go.th 
    • ผู้ค้าได้ประโยชน์ ทำให้ทราบว่าหน่วยงานใดตั้งงบประมาณมากขึ้นเรื่อยๆ ทุกปี

เครื่องมือที่น่าสนใจ

  1. KitWai Data Mining Cloud Platform:
    KitWai : คิดไว คิดใหญ่ ไม่ยาก https://www.facebook.com/KitWaiNECTEC/
  2. Tableau Sotware https://www.tableau.com
    สำหรับ visualization & data analytics เป็น software ที่ NECTEC ใช้ในการแสดงตัวอย่างการวิเคราะห์ข้อมูบการวิ่งของรถเมล์

ตัวอย่าง: การใช้งบประมาณของรัฐ

ii85908v855709

ดร. สุทธิพงศ์ ธัชยพงษ์ ผู้เชี่ยวชาญพิเศษทางด้าน anomaly detection สาธิตการวิเคราะห์ข้อมูลการใช้จ่ายภาครัฐ โดยนำข้อมูลจากสองหน่วยงานมารวมกัน คือ กรมบัญชีกลาง และ สำนักงบประมาณ สิ่งที่มองเห็นได้คืองบประมาณจำนวนไม่น้อยถูกใช้ไปกับการทำถนน เมื่อลองดูความสัมพันธ์ระหว่างงบประมาณกับ GPP (Gross Provincial Product?) จะพบว่า ข้อมูลมักจะไปด้วยกัน โดยมี outliers ที่น่าสนใจเช่น

  • จังหวัดระยอง: มี GPP สูงมากเมื่อเทียบกับงบทำถนน
    คาดว่าเป็นเพราะมีอุตสาหกรรมใหญ่ที่สร้างรายได้สูง
  • จังหวัดประจวบคีรีขันธ์: มีงบทำถนนสูง แต่มี GPP ไม่สูงนัก
    คาดว่าเป็นเพราะเป็นทางผ่านไปยังจังหวัดอื่นๆ จึงต้องใช้งบในการทำถนนมาก

ตัวอย่าง: ข้อมูลการจราจร และการขนส่งมวลชน

tg5624kp1615yu

ดร. วสันต์ ภัทรอธิคม จากห้องปฏิบัติการระบบขนส่งและจราจรอัจฉริยะ เล่าให้ฟังว่าปัจจุบันประเทศไทยเป็นแชมป์โลกในด้านจำนวนผู้ตายจากอุบัติเหตุบนท้องถนน ในปี 2558 มีคนตาย 23,760 คน นับเป็นกว่า 4 เท่าของคนที่ตายในเหตุการณ์ Tsunami (โอโห!)

ฐานข้อมูลด้านการจราจร ประกอบด้วย CCTV (กล้องวงจรปิด) ตามจุดต่างๆ,  GPS ที่ติดตามรถโดยสารสาธารณะ, sensors บนถนนและทางด่วน เพื่อบอกความเร็วและชนิดของรถ ข้อมูลเหล่านี้ถูกนำมาจัดระเบียบโดย http://gps.traffy.in.th/ และแสดงผลที่เว็บ http://highway.traffy.in.th/

screenshot-2016-09-19-13-52-12

เมื่อคลิกดูที่ตำแหน่ง sensor ก็สามารถเห็นข้อมูลโดยละเอียดได้

screenshot-2016-09-19-14-06-39

คุณ ชูชาติ ซาปัน จาก ขสมก. เล่าให้ฟังถึงผลจากความร่วมมือระหว่าง ขสมก. กับ NECTEC ว่านอกจากจะทำให้ผู้ใช้บริการพึงพอใจรถเมล์สาย 8 และสาย 73 มากขึ้นแล้ว ขสมก. ยังได้ประโยชน์ในแง่ของการอบรมพนักงาน เพราะผู้โดยสารสามารถรายงานการขับรถไม่ปลอดภัยได้ นอกจากนี้ระบบยังวิเคราะห์การขับซิ่ง ขับออกนอกเส้นทาง และขับเร่งแซงกันได้ แต่ที่สำคัญที่สุดก็คือ ขสมก. มีรายได้มากขึ้นอีกด้วย เพราะเมื่อผู้โดยสารทราบว่ารถเมล์กำลังจะมาในอีกไม่นาน ก็จะตัดสินใจรอ ไม่รีบขึ้น taxi ไปก่อน

ตัวอย่างของระบบการแสดงผลการติดตามรถเมล์สาย 73 ซึ่งสามารถติดตามผ่านเว็บและผ่าน app บนโทรศัพท์ได้ http://dash.traffy.in.th/

screenshot-2016-09-19-14-11-10

ผู้บรรยายบอกว่าในอนาคต มีแผนจะใช้ GPS ของ USA ร่วมกับจีนและประเทศอื่นๆ เพื่อให้ได้ความละเอียดแม่นยำมากขึ้นถึงขนาดที่สามารถบอกได้ว่ารถเมล์วิ่งอยู่บนเลนไหน จอดตรงป้ายหรือไม่ จอดชิดซ้ายหรือไม่

สำหรับ challenge ที่สำคัญของการเปิดรับข้อมูลจากผู้โดยสาร (ทั้งในแง่ตำแหน่งรถและความคิดเห็นต่างๆ) คือจะต้องหาประโยชน์จากการเปิด app มาเป็นแรงจูงใจให้กับ user

How about small data?

t134200i4404ca

ดร. วสันต์ ทิ้งท้ายด้วยแง่คิดที่สำคัญว่า ในหลายกรณีองค์กรต่างๆ สามารถได้ประโยชน์จากการวิเคราะห์ข้อมูลขนาดเล็กเช่นกัน โดยยกตัวอย่างการวิเคราะห์การใช้งานลิฟท์ของอาคารสำนักงาน โดยมีข้อมูลการกดลิฟท์ และข้อมูลตำแหน่งลิฟท์ในช่วงเวลาต่างๆ เพื่อหาคำตอบของสองปัญหานี้:

  1. ควรเปิดใช้ลิฟท์ 2 ตัวพร้อมกันในช่วงเวลาไหน?
  2. ลิฟท์ควรจอดรอที่ชั้นไหน?

จากตัวอย่างการวิเคราะห์จากข้อมูลการใช้งานจริง พบว่าเวลาที่ควรเปิดลิฟท์สองตัวนั้นควรเลื่อนออกไปอีกนิดหน่อย และฝ่ายบริหารก็อาจตัดสินใจขยายเวลาการเปิดลิฟท์ตัวที่สองอีก 1 ชั่วโมง และจะทราบทันทีว่าจำนวนคนที่จะได้รับบริการมากขึ้นนั้นมีกี่คน


สรุป

  1. เทคโนโลยีทางด้านภาษาไทยของ NECTEC เป็นสิ่งที่น่าสนใจมาก โดยเฉพาะโปรแกรมตัดคำ และอาจรวมไปถึงพจนานุกรม (เพื่อให้ทราบชนิดของคำ), และ sentiment analysis
    • สมควรรีบทดลองใช้โดยเร็ว
    • สมควรเร่งค้นหาว่ามีทางเลือกอื่นอะไรบ้าง (เช่น ม.เกษตรศาสตร์, CMU) และมีข้อดีข้อเสียต่างกันอย่างไร
  2. สิ่งสำคัญที่จะทำให้ Open Data และ Big Data มีความหมายสำหรับคนหมู่มากคือ data visualization ในส่วนนี้ NECTEC ไม่ได้มี tool สำเร็จรูปมากนัก แต่มีตัวอย่างการวิเคราะห์ข้อมูลต่างๆ ที่น่าจะเป็นประโยชน์มาก

Files

  • บันทึกบนกระดาษ (โดย Mock): 160912-nectec-ace (pdf)