สิ่งที่ควรรู้เกี่ยวกับ "ศูนย์บิ๊กดาต้า" จับตา "จอมส่อง"

หน้าจอบล๊อกเว็บไซต์ กระทรวงดีอี Image copyright WASAWAT LUKHARANG/BBC THAI

บทบาทของโซเชียลเน็ตเวิร์คอย่างเฟซบุ๊ก และทวิตเตอร์นับวันยิ่งทวีความสำคัญมากขึ้น ทั้งในด้านสนับสนุนธุรกิจ การแสดงความคิดเห็นของคนในสังคม แต่ในอีกมุมหนึ่งกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม (ดีอี) มองว่า ปัจจุบันพฤติกรรมกระทำความผิดผ่านโซเชียลเน็ตเวิร์คก็มีแนวโน้มรุนแรงขึ้น ส่งผลกระทบโดยตรงต่อสถาบันพระมหากษัตริย์และความมั่นคงของประเทศ รวมไปถึงการกระทำหรือการแสดงความคิดเห็นในลักษณะ ปลุกปั่น สร้างความเกลียดชัง

มุมมองดังกล่าวของกระทรวงดีอี ปรากฎในส่วนหลักการและเหตุผลของเอกสารขอบเขตของงาน หรือ ทีโออาร์ ในการจัดตั้ง "ศูนย์ข้อมูล Big Data และวิเคราะห์อาชญากรรมเทคโนโลยี เพื่อความสงบเรียบร้อยของประชาชน สังคม และความมั่นคงของชาติ" ภายใต้งบประมาณ 128.4 ล้านบาท ซึ่งเป็นงบประมาณผูกพันของปีนี้และปีหน้า

อย่างไรก็ตาม น.อ.สมศักดิ์ ขาวสุวรรณ์ รองปลัดกระทรวงดีอี ชี้แจงผ่านสื่อเช่น เว็บไซต์มติชนออนไลน์ และผู้จัดการออนไลน์ ในวันนี้ (24 พ.ค.) ว่า ระบบดังกล่าวไม่ได้ใช้จับผิดประชาชน แต่มีไว้เพื่อสืบหาการกระทำผิดเกี่ยวกับคอมพิวเตอร์ นอกจากนี้ยังเป็นการขยายขีดความสามารถของเจ้าหน้าที่ในการดำเนินการเกี่ยวกับเนื้อหาตามเว็บไซต์และสื่อสังคมออนไลน์ ที่พบว่าเป็นความผิดตามกฎหมาย

บีบีซีไทยรวบรวมประเด็นที่น่าสนใจเกี่ยวกับ ศูนย์ข้อมูลดังกล่าวนี้ที่จะทำหน้าที่จับตา หรือ "บิ๊กบราเธอร์" ผู้ใช้งานโซเชียลเน็ตเวิร์คทุกคนในประเทศนี้ในอนาคต

ใครจะรับบทเป็น 'บิ๊กบราเธอร์'

เมื่อพิจารณาจากเอกสารทีโออาร์ ของตั้งศูนย์ข้อมูลดังกล่าวจะประกอบด้วยคณะทำงาน 30 คน ที่ผลัดเวรกันทำงานตลอด 24 ชั่วโมง โดยจะจัดจ้างเจ้าหน้าที่ปฏิบัติงานจากกองบังคับการปราบปรามการกระทำความผิดเกี่ยวกับอาชญากรรมทางเทคโนโลยี หรือ ปอท.

Image copyright Leon Neal/AFP/Getty Images

โดยในจำนวนนั้น จะมีผู้เชี่ยวชาญจาก ปอท. 2 คน โดยผู้เชี่ยวชาญคนแรกจะต้องมีความสามารถด้านการประมวลผลทางภาษา อย่างเช่น ภาษาธรรมชาติ ปัญญาประดิษฐ์ ด้านการแปลภาษาด้วยเครื่อง การรู้จำตัวอักษรไทย การสังเคราะห์เสียงด้วยข้อความภาษาไทย และการสืบค้นแบบข้อความเต็ม (Full Text Search)

ส่วนผู้เชี่ยวชาญอีกคน ต้องมีความรู้ความสามารถในการจัดการข้อมูลขนาดใหญ่ (Big Data) ตั้งแต่การจัดเก็บข้อมูลและวิเคราะห์ข้อมูลจากโซเชียลเน็ตเวิร์ค เช่น การทำเหมืองข้อมูล (Data Mining) และการทำเหมืองเว็บ (Web Mining)

ข้อมูลของผู้ใช้โซเชียลเน็ตเวิร์คจะถูกวิเคราะห์อย่างไร

ตามเงื่อนไขทีโออาร์ ได้กำหนดให้ผู้ประมูลต้องเสนอระบบที่มีความสามารถในการวิเคราะห์ข้อมูลที่รองรับความหลากหลายในการสื่อสารในยุคปัจจุบัน เช่น ความสามารถในการกรองข้อมูลที่ต้องการค้นหาคำคล้ายกันได้ เช่น คำว่า "อีเมล์" กับ "อีเมล" หรือคำพ้องเสียง เช่น คำว่า "กานต์" "การ" "กาล" หรือ "กาฬ" นอกจากการค้นหาด้วยคำสำคัญคือสามารถค้นหาเป็นวลีได้

Image copyright Peter Macdiarmid/Getty Images

นอกจานี้ ระบบของผู้ประมูลนำเสนอจะต้องมีความสามารถเลือกกรองเนื้อหาตามความรู้สึกได้ โดยสามารถกรองได้ในระดับการเลือกโพสต์และเพจ ความเห็นต่อโพสต์ นั้นและความคิดเห็นของคลิปวิดีโอใน ยูทิวบ์ นอกจากนี้ยังสามารถรวม (Merge) ผู้ใช้จากสังคมออนไลน์ที่ต่างกัน ในกรณีที่รู้ข้อมูลอื่นเพิ่มเติม เช่น อีเมล์เดียวกัน อีเมล์ใกล้เคียงกัน หรือ เนื้อหาใกล้เคียงกัน

คุณทราบหรือไม่ศูนย์นี้สามารถติดตามคุณได้

ระบบของผู้ประมูลจะต้องมีความสามารถในการติดตามเหตุการณ์ที่เกิดขึ้นในเครือข่ายสังคมออนไลน์ ที่เจ้าพนักงานต้องการติดตามได้ เช่น การติดตามการโพสต์ทวีตของผู้ใช้คนใดคนหนึ่ง เหตุการณ์ที่ผู้ใช้โพสต์วิดีโอในเครือข่ายยูทิวบ์ได้ โดยไม่เลือกข้อมูลใดๆ แล้ว จะต้องแสดงข้อมูลที่เกี่ยวข้อง เช่น

  • ในกรณีที่เป็นทวีต จะต้องสามารถแสดงข้อมูลการรีทวีตของทวีตนั้นได้
  • ในกรณี ยูทิวบ์ ต้องสามารถแสดง คอมเมนต์ หรือการแสดงความคิดเห็นที่เกี่ยวข้องได้
  • ในกรณีโพสต์บนเฟซบุ๊ก เพจ ต้องสามารถแสดงคอมเมนต์ และไลค์ ที่เกิดขึ้นได้
  • ในกรณี อินสตาแกรม ต้องสามารถแสดง คอมเมนต์และ ไลค์ ที่เกิดขึ้น

ผู้ประมูลต้องจัดให้มีระบบที่สามารถวิเคราะห์การกระจายข้อมูลในโซเชียลเน็ตเวิร์คได้ โดยจัดเก็บและวิเคราะห์ตามเวลาที่ผู้ใช้มีปฏิสัมพันธ์กับเครือข่ายได้ โดยกรองข้อมูลตามเวลาที่ต้องการแสดงได้

จับตาความสัมพันธ์ระหว่างผู้ใช้งานได้

ความสามารถอีกประการของศูนย์ดังกล่าวนี้ตามทีโออาร์กำหนด คือระบบต้องสามารถค้นหาชุมชนเสมือนในโซเชียลเน็ตเวิร์คได้ โดยการวิเคราะห์ความสัมพันธ์ของผู้ใช้ได้ สามารถค้นหาผู้ใช้ที่มีอิทธิพลสูงในโซเชียลเน็ตเวิร์ค ได้จากการเชื่อมต่อไปยังผู้ใช้คนอื่นๆ รวมถึงในเชิงพฤติกรรมการส่งต่อข้อมูลในโซเชียลเน็ตเวิร์ค

ขณะที่ระบบดังกล่าวจะสามารถเก็บข้อมูลแสดงกราฟความสัมพันธ์ระหว่างผู้ใช้และแสดงเป็นกราฟความสัมพันธ์ระหว่างผู้ใช้ได้ในระดับผู้ใช้จำนวนล้านคนขึ้นไป โดยต้องสามารถแสดงข้อมูลที่มีความหมายเพื่อให้เจ้าพนักงานสามารถเลือกโหมดที่ตนเองสนใจได้ง่าย

Image copyright JONATHAN NACKSTRAND/AFP/Getty Images

ที่น่าสนใจอีกประเด็นคือ ระบบจะต้องสามารถนำเสนอตำแหน่งบนแผนที่ของผู้ใช้งานแต่ละคนรวมทั้ง กลุ่มผู้ใช้แต่ละคนในเครือข่ายโซเชียลเน็ตเวิร์คได้ โดยต้องสามารถแสดงผลลัพธ์ได้ตามช่วงเวลา ณ เวลาใดเวลาหนึ่ง นอกจากนี้ยังระบบต้องสามารถวิเคราะห์ความคล้ายกันของผู้ใช้และกลุ่มผู้ใช้ในโซเชียลเน็ตเวิร์ค ได้ โดยใช้ข้อมูลเชิงโครงสร้างของผู้ใช้ได้ ในขณะเดียวกันยังสามารถค้นหาและแสดงแนวโน้มของคำสำคัญที่ปรากฎในเนื้อหาของวัตถุต่างๆ ที่เก็บไว้ได้

นี่เป็นเพียงส่วนหนึ่งของข้อกำหนดในทีโออาร์ ที่กระทรวงดีอี กำหนดและกำลังดำเนินการจัดซื้อจัดจ้างด้วยระบบอิเล็กทรอนิกส์ โครงการดังกล่าวได้รับการประกาศกำหนดราคากลางทางเว็บไซต์ของกระทรวงดีอี ตั้งแต่วันที่ 3 พ.ค.ที่ผ่านมา โดยมี พล.ต.ต.ศุภเศรษฐ์ โชคชัย ผู้บังคับการ ปอท.เป็นประธานกรรมการร่างทีโออาร์ เมื่อการประกวดราคาแล้วเสร็จ ศูนย์ดังกล่าวคาดว่าจะเริ่มดำเนินการได้ตั้งแต่วันที่ 1 ต.ค.นี้ จนถึงวันที่ 31 ก.ค. 2561

ทั้งนี่้ มีการเปิดเผยข้อมูลเรื่องการใช้งานโซเชียลมีเดียของคนไทยในปี 2559 ในงาน "Thailand Zocial Awards 2017" ที่จัดขึ้นวานนี้ (23 พ.ค.) ว่า มีคนไทยใช้งานเฟซบุ๊กสูงถึงกว่า 47 ล้านราย หรือคิดเป็นร้อยละ 70 ของประชากรทั้งประเทศ รองลงมาคือ อินสตาแกรม 11 ล้านราย และทวิตเตอร์ 9 ล้านราย หากการติดตั้งระบบของ ปอท.แล้วเสร็จ อาจทำให้ผู้ใช้งานโซเชียลมีเดียทั้ง 3 แพลตฟอร์มนี้ ตกอยู่ในข่าย "ถูกจับตา"