v4_pr4ql.jpg

 डॉ. मिखाल कोशिन्स्की हा डेटा-संशोधक, त्याच्या संशोधन-क्षेत्राची माहिती देणारा “The data that turned the world upside down” हा लेख आणि त्याचं गिरीश कुबेरांनी केलेलं भाषांतर* गेले काही दिवस चर्चेत आहे.

फेसबुकसारख्या व्यासपीठावर लोकांच्या पोस्ट्स, लाईक्स आणि त्यांनी व्यक्त केलेल्या विचारांच्या आधारे तयार झालेला ‘बिग डेटा’ वापरून राजकारणी जनमत त्यांच्या बाजूनं वळवू लागले आहेत असं काहीसं भयावह चित्र या लेखानं निर्माण होतं.

गेल्या महिनाअखेरीस हा लेख vice  या वेबसाईटवर प्रसिद्ध झाला होता. वाचल्यावर मीही उडाले होते. गेल्या वर्षी नोव्हेंबरमध्ये अमेरिकेत असताना तिथल्या एका पत्रकारानं आणि एका जर्मन मित्रानंही मिखाल कोशिन्स्कीचा उल्लेख केला होता. तेव्हापासून या विषयाचा अभ्यास करते आहे, मिखालचे आधीचे काही लेखही वाचायला मिळाले आहेत. (होय, हा उच्चार मिखाल with ‘ख’ silent असा आहे- ‘मिहाल’ च्या जवळपास जाणारा, पण मायकल असा नाही..)  

माझ्या वाचनात आलेले आणि मला जाणवलेले काही मुद्दे इथं मांडते आहे.

aaeaaqaaaaaaaaijaaaajdnmndu4otk0lweyotatndc1my04m2qylwe4ngvlodu1zwixyq

  1. ‘बिग डेटा’चा खरंच निवडणुकीच्या किंवा जनमत चाचण्यांच्या निकालावर परिणाम होतो का?आणि होत असेल, तर भविष्यात बिग डेटाच्या आधारेच निवडणुका लढवल्या जातील का? सध्यातरी या प्रश्नाचं निश्चित उत्तर देता येणार नाही. पण डोनाल्ड ट्रम्प बिग डेटामुळं जिंकले किंवा ब्रेक्झिटचा कौल बिग डेटामुळंच लागला असं म्हणणंही सध्याच्या घडीला चुकीचं ठरतं.

स्वतः मिखाल कोशिन्स्कीनं ब्लूमबर्गला दिलेल्या मुलाखतीत “डेटा निवडणूक जिंकत नाही, तर उमेदवारच जिंकतात” असं मत मांडलं आहे.

ट्रम्प यांच्याप्रमाणेच हिलरी क्लिंटन यांच्याकडेही बिग डेटा उपलब्ध होता आणि त्यांनीही डेटाच्या आधारे कॅम्पेनिंग केलं होतं. इतकंच काय, ट्रम्प यांच्याप्रमाणेच रिपब्लिकन पक्षाचे उमेदवार टेड क्रूझनीही केंब्रिज अॅनालिटिका कंपनीचीच मदत घेतली होती, पण ते प्राथमिक निवडणुकीतच मागे पडले. ट्रम्प यांना अमेरिकेच्या ग्रामीण प्रदेशात, भौगोलिक ‘मिडवेस्ट’ राज्यांत राहणाऱ्या सर्वसामान्यांच्या मनातल्या भावना कळल्या, ते त्यांचीच भाषा बोलू लागले आणि त्याच राज्यांवर लक्ष केंद्रीत करून निवडणूक जिंकली, हे वास्तव आहे. त्यासाठी बिग डेटाचीही गरज नाही. आपल्याकडचे राजकारणी बिग डेटा नसतानाही आपापला गड कसा राखतात? तसंच काहीसं आहे हे. 

अर्थात कुठला गड आपला आहे हे स्पष्ट कऱण्यात बिग डेटा मदत करू शकतो. त्यामुळं अशा डेटाशी निगडीत काम करणाऱ्या कंपन्यांना येत्या काही वर्षांत सुगीचे दिवस येणार हे नक्की आहे.

  1. ‘बिग डेटा’फसवाही असू शकतो. तसंच तो फक्त ट्रेण्ड दाखवतो. त्यामुळं डेटा अॅनालिस्ट्सच्या आणि ब्रँड बिल्डर्सच्या विश्वात सध्या बिग डेटापेक्षाही ‘small data’ जास्त महत्त्वाचा मानला जातो. 

बिग डेटा हा एका विशिष्ठ कालावधीत मोठ्या समूहाकडून माहिती जमा केल्यानं तयार होतो. तर स्मॉल डेटा म्हणजे एखाद्या छोट्या गोष्टीविषयीची विशिष्ठ/नेमकी आणि ताजी माहिती. आपलं मागचं उदाहरणच वापरून स्पष्ट करायचं तर, आपला गड राखण्यासाठी कुठला उपाय प्रभावी ठरेल, याविषयीची माहिती. लोकांना स्वप्न दाखवली, त्यांना आलेला राग कसा बरोबर आहे असं म्हटलं, त्यांना कशापासून तरी धोका आहे हे सांगितलं, तर ते आपल्यावर विश्वास ठेवतात हा ‘स्मॉल‘ डेटा ट्रम्पना आधी व्यवसायात आणि मग निवडणुकीत यश मिळवण्यासाठी कामी आला. 

(या स्मॉल डेटानं जग कसं बदललं आहे, हे सांगणारं एक पुस्तक ब्रँड एक्सपर्ट मार्टिन लिंडस्टॉर्मनं गेल्या वर्षी लिहिलं आहे. मला भारतात ते अजून मिळू शकलेलं नाही.)

  1. बिग डेटा’जमा करणाऱ्या कंपन्या त्याचा गैरफायदा घेऊ लागल्या तर त्यापासून कसं वाचायचं? 

फेसबुकच्या सुरुवातीच्या दिवसांत तुमचे लाईक्स सर्रास सर्वांना दिसत. त्यावेळी प्रायव्हसी सेटिंग्जही प्रभावी नव्हती. पण मिखाल कोशिन्स्कीचं संशोधन प्रसिद्ध झाल्यावर फेसबुकनं त्या गोष्टींत बदल केले. त्यासाठी कोशिन्स्कीची मदतही घेतली.

तुम्हाला आठवत असेल, तर फेसबुकवर सुरुवातीला खूप साऱ्या क्वीझ, गेम्सचा भडीमार होता. त्यात सहभागी व्हायचं तर तुम्हाला प्रोफाईलला फुल अॅक्सेस द्यावा लागायचा. अशा अॅप्समधूनच तुमच्याविषयीची माहिती गोळा केली जाते आणि बिग डेटा तयार होतो. त्यामुळं सर्वात आधी फेसबुकच्या सेटिंग्समध्ये जाऊन आपण कुठल्या अॅप्सना फ्री अक्सेस दिला आहे, हे चेक करा, अनावश्यक अॅप्स काढून टाका आणि दुसरं म्हणजे अधूनमधून डिजिटल ब्रेक घेत जा.

  1. स्वतः गुगल आणि फेसबुकही अशा बिग आणि स्मॉल डेटाचा फायदा उठवतातच. फेसबुक रोज सकाळी विशिष्ठ अल्गोरिदमनुसार विशिष्ठ आठवणी उपसून वर काढतं, आपल्या विचारांवर त्याचा परिणाम होतोच की. आपण ज्या पोस्टस लाईक करू किंवा अगदी जो विषय गुगलमध्ये सर्च करू, त्याच्याशी निगडीत जाहिराती फेसबुकवर दिसू लागतात. गुगलचं पर्सनलाईज्ड सर्च इंजिन सुद्धा काहीसं असंच वागतं. त्यामुळं बहुतेक वेळा incognito mode मध्ये सर्च करणं, वेब ब्राऊजरमधली History, Cache डिलीट करणं अशा सवयी फायद्याच्या ठरतील. 
  2. बिग डेटा फक्त सोशल मीडियापुरता मर्यादित नाही. तो कुठूनही जमा केला जाऊ शकतो. ऑनलाईन आणि ऑफलाईन दोन्ही स्वरूपांत. म्हणजे हजारो लोकांनी एखाद्या विशिष्ठ कामासाठी केलेले अर्जही बिग डेटा बनू शकतात. प्रत्यक्ष कागदपत्रांची वाहतूक सोपी नसल्यानं अशा बिग डेटाचा गैरफायदा घेण्याच्या घटना तुलनेनं अगदी तुरळक आहेत आणि याच कारणांमुळं टोटल डिजिटायझेशनला अनेकांचा विरोध आहे. विशेषतः भारतासारख्या देशात, जिथं डेटा स्वस्तात उपलब्ध होतो, डेटा सर्व्हर्सवर हॅकर्सचे हल्ले कठीण नाहीत आणि मूळात डिजिटल व्यवहारांविषयी बहुतांश लोक अजूनही अनभिज्ञ आहेत.
  3. Demonetizationनंतर तर बिग डेटाचा गैरवापर होण्याची भीती आणखी वाढली आहे. कारण कॅशलेस इंडिया आणि डिजिटल व्यवहारांवर भर दिला जातो आहे. त्यामुळं माझ्या मनात प्रश्न उभा राहिला आहे – उदाहरणार्थ, तुम्ही क्रेडीट कार्ड वापरत असाल आणि त्यातून जमा झालेली माहिती एखाद्याच्या हाती लागली तर – तुमचं उत्पन्न, तुम्ही कुठं काय आणि किती खरेदी करता, वाणसामानाच्या बाबतीत वर्षातून एकदा खरेदी करता की महिन्यातून की, आठवड्याला, यावरून तुमच्या खाण्या-पिण्याच्या सवयी,तुम्ही जेवण बनवण्याच्या बाबतीत आळशी आहात की नीटनेटके याविषयी ढोबळ निष्कर्ष काढता आला तर? डेटा-अॅनालिस्ट मित्राचं उत्तर – होय हे शक्य आहे. 
  4. भारत सरकारनं कॅशलेस व्यवहारांसोबतच आधार कार्ड, डिजिटल लॉकरची योजना लागू केली आहे. पण इथंही तीच भीती आहे. त्यामुळं आधार कार्डला अनेकांनी वेळोवेळी विरोध केला आहे. ( सर्वोच्च न्यायालयातील केसेस, सुचेता दलाल यांचे लेख)

आधार कार्ड हे केवळ ओळखपत्र नाही, तर डेमोग्रॅफिक आणि बायोमेट्रिक माहिती जमा करणारी यंत्रणाही आहे. उद्या माझी सर्व अकाऊंट्स मी आधार कार्डशी जोडली तर त्या डेटाच्या सुरक्षिततेची किती खात्री देता येईल? हा डेटा कदाचित विकला जाणार नाही, पण कुणा हॅकर्सच्या हाती लागला तर? आधार कार्डवरून बँक अकाऊंट्स आणि बँक अकाऊंट्सवरून पैसे खर्च करण्याच्या सवयीपर्यंत पोहोचता येतंच की.

  1. याच कारणांसाठी मी व्यक्तिशः ओला/उबरसारख्या टॅक्सी सर्व्हिसेसही वापरणं टाळते. कारण तिथं जमा होणाऱ्या एरिया, लोकेशन यांसारख्या बिग आणि स्मॉल डेटाचा गैरवापर झाल्याच्या घटना घडल्या आहेत. मी कुठे जाते, यावरून माझ्या स्वभावाविषयी कोणी आडाखे बांधलेले मला नाही आवडणार. आणि एखाद्या व्यक्तीची नेहमीची जाण्यायेण्याची ठिकाणं माहिती झाली तर ती व्यक्ती हल्लेखोरांसाठी, स्टॉकर्ससाठी ईझी टारगेट बनू शकते.

या सगळ्या मुद्द्यांवर अधिक सखोल संशोधन करून मगच काहीतरी लिहावं असं मनात होतं. पण लोकसत्तामध्ये आलेलं भाषांतर पाहून आत्ताच माझ्या नोट्स मी इथे शेअर केल्या आहेत.   

………………..

* खरं तर मला गंमत वाटते आहे सगळ्या प्रकाराची.  लोकसत्ताचा प्रिंटमधला लेख मी वाचलेला नाही. पण ऑनलाईन एडिशनमध्ये तरी मूळ लेखाचा उल्लेख आहे. त्यामुळं थेट plagiarismचा आरोप करता येणार नाही.  तरीही या लेखाचा ‘कुबेरांचा लेख’ असा उल्लेख खटकतोच. 

आधी एका जर्मन मासिकात आणि त्यानंतर vice.com या वेबसाईटवर इंग्रजीमध्ये हा लेख प्रसिद्ध झाला होता. आता एखादा लेख जसाच्या तसा किंवा त्याचा गोषवारा मराठीत आणण्यास हरकत नाही. पण हे भाषांतर आहे हे आणखी स्पष्टपणे – बायलाईनमध्येही सांगता आलं असतं. मूळ जर्मन लेखाचं इंग्रजीत भाषांतर करताना हीच खबरदारी घेण्यात आली आहे.

काही वर्षांपूर्वी केवळ काही ओळी जशाच्या तशा उचलल्या म्हणून सीएनएनच्या फरिद झकारियावर निलंबनाची कारवाई करण्यात आली होती. आपण मात्र कॉपिराईट्स आणि Plagiarism बाबत उदासीनच असल्यासारखं वाटतं. 

मराठी वृत्तपत्र वाचणारा वाचक टेकसॅव्ही आणि इंग्लिश वाचणारा नाही अशा (गैर)समजामुळं तर असं झालेलं नाही ना? 

पत्रकारांनीच भान ठेवायला हवं. कुठलीच गोष्ट लपून राहात नाही कारण ‘कुणीतरी आहे तिथं.. ‘ 

– जान्हवी मुळे