হারিয়ে যাওয়া ইন্টারনেটের তথ্যের খোঁজে
বিআলো ডেস্ক: ২০১৩ সালেরও আগের ইন্টারনেটের বেশির ভাগই আজ আর নেই। বর্তমান দুনিয়ার ঘটনাবলি ও ইতিহাসের সঙ্গে ইন্টারনেট ওতপ্রোতভাবে জড়িত। ইন্টারনেটের তথ্য এভাবে মুছে যাওয়া ইতিহাসের দলিল হারিয়ে যাওয়ার শামিল। ওয়েবের তথ্য সংরক্ষণে আজও আনুষ্ঠানিকভাবে কোনো উদ্যোগ নেওয়া হয়নি। তবে বেশ কিছু স্বেচ্ছাসেবী সংস্থা অনানুষ্ঠানিকভাবে ইন্টারনেটকে সংরক্ষণের চেষ্টা চালিয়ে যাচ্ছে। তার মধ্যে সবচেয়ে বড় সংস্থা ‘ইন্টারনেট আর্কাইভ’।
১৯৯৬ সালে ইন্টারনেটের অগ্রদূত ‘ব্রিউস্টার স্টাল’ যুক্তরাষ্ট্রের সান ফ্রান্সিসকোতে শুরু করেন এই অলাভজনক সংস্থা। এখন পর্যন্ত ৮৬ হাজার ৬০০ কোটি ওয়েব পেজ, চার কোটি ৪০ লাখ বই এবং এক কোটি ছয় লাখ ভিডিও, সিনেমা এবং টিভি প্রগ্রাম তারা সংরক্ষণ করেছে। বিশ্বের বেশ কিছু দেশে ছড়িয়ে-ছিটিয়ে থাকা ডাটা সেন্টারে তথ্যগুলো সংরক্ষিত আছে। তাদের পাশাপাশি আরো কিছু স্বেচ্ছাসেবী দলের তৈরি আর্কাইভের বাইরে ইন্টারনেটের গুরুত্বপূর্ণ সব অংশের নেই কোনো ব্যাকআপ।
শুধু সার্ভার ও ডাটা সেন্টারের ব্যর্থতাই নয়, বরং সরকার, সংস্থা ও প্রতিষ্ঠানের উত্থান ও পতনেই ইন্টারনেটের তথ্য ধ্বংসের মূল কারণ। এমনটাই বলছেন ইন্টারনেট আর্কাইভের ওয়েব্যাক মেশিন অংশের ডিরেক্টর মার্ক গ্রাহাম। ওয়েব্যাক মেশিন বেশ কিছু টুলস ব্যবহার করে প্রতিনিয়ত বিভিন্ন ওয়েবসাইটের তথ্য স্বয়ংক্রিয়ভাবে সংরক্ষণ করে থাকে।
তাদের দাবি, ইন্টারনেটে নতুন তথ্য প্রকাশের পেছনের সংস্থা ও প্রতিষ্ঠানগুলো অনেক কাঠখড় পোড়ালেও সেগুলো দীর্ঘ সময় সংরক্ষিত রাখা নিয়ে কোনো মাথাব্যাথা নেই। নৃতত্ত্ববিদরা মনে করেন, ১৯৯০ থেকে ২০০৬ সাল পর্যন্ত মানব ইতিহাসের বড় অংশ ছিল ছোট ছোট সেলফ হোস্ট করা ওয়েবসাইট। সামাজিক যোগাযোগ মাধ্যম তখনো আবিষ্কার না হওয়ায় অনলাইনে নিজস্ব মতামত প্রকাশ করার উপায় ছিল কোনো হোস্টিং সেবায় নিজস্ব ওয়েবসাইট খোলা। এর মধ্যে ‘জিওসিটিজ’ ছিল সবচেয়ে জনপ্রিয় সেলফ হোস্টিং সেবা।
জিওসিটিজ বন্ধ হয়ে যাওয়ার মাধ্যমে ইন্টারনেটের প্রথম দিকের ইতিহাস পুরোটাই মুছে গেছে বলা যায়। জিওসিটিজের হারিয়ে যাওয়া পাতাগুলো ওয়েব্যাক মেশিনের মাধ্যমে ফিরিয়ে এনে প্রথমবারের মতো ইন্টারনেট আর্কাইভস লাইমলাইটে হাজির হয়। তাদের কার্যক্রমের কল্যাণে আজো প্রাথমিক যুগের ইন্টারনেট কেমন ছিল তা দেখা সম্ভব।
শুধু যে ভবিষ্যতের ইতিহাস গবেষকদের জন্যই ইন্টারনেট আর্কাইভ জরুরি, তা কিন্তু নয়। এক্সপায়ার ওয়েবসাইট দেখার জন্য একমাত্র উপায় এই ইন্টারনেট আর্কাইভ। বর্তমানে বেশির ভাগ সরকারি-বেসরকারি সংস্থার ওয়েবসাইটে অনেক এক্সপায়ার করা লিংক রয়েছে, যেগুলো ভিজিট করার একমাত্র উপায় ইন্টারনেট আর্কাইভ। বেশ কিছু সংস্থা এর মধ্যেই নিজেদের ওয়েবসাইটে ওয়েব্যাক মেশিনের লিংক ব্যবহার শুরু করেছে।
উইকিপিডিয়ার অনেক আর্টিকলে সোর্স হিসেবে ওয়েব্যাক মেশিনের লিংক দেওয়া হচ্ছে। একটি স্বেচ্ছাসেবী, অলাভজনক সংস্থার ওপর এমন গুরুত্বপূর্ণ দায়িত্ব চাপিয়ে দিয়েই বড় বড় সব ওয়েবসাইটের মালিকরা খালাস। ডোনেশনের ওপর ভিত্তি করে একটি সংস্থা আর কতটাই বা তাদের কাজের পরিধি বাড়াতে পারে।
মাত্র একটি সংস্থার সব ইন্টারনেট আর্কাইভিংয়ের দায়িত্ব নেওয়া কোনোভাবেই সমীচীন নয়। কোনো কারণে সংস্থাটি বন্ধ হয়ে গেলে আর্কাইভও সেখানেই শেষ। কিছুদিন আগেই কপিরাইটজনিত মামলায় ইন্টারনেট আর্কাইভকে বড় জরিমানা করেছে যুক্তরাষ্ট্রের আদালত। আরো একটি বড় মাপের মামলা এখনো চলমান। বই, সিনেমা ও সংগীতে কপিরাইটধারীদের দাবি, সংরক্ষণের নামে পাইরেসি করছে সংস্থাটি। আইনগত জটিলতার বাইরে প্রতিনিয়ত সাইবার হামলার হুমকি তো রয়েছেই।
সব নৃতত্ত্ববিদ এবং ইতিহাসবিদদের চাওয়া একটাই, ইন্টারনেটকে সংরক্ষণ করার দায়িত্ব বিশ্বের প্রতিটি দেশ ও সরকারের নেওয়া উচিত। যাতে একটি আর্কাইভের পতন হলেও আরও ব্যাকাপ থেকে যায়।
বিআলো/শিলি