Skip to main content

Reading Web Tea Leaves

BM recently launched WebFountain, an ambitious commercial service that mines valuable information from about half of the web's content, including informal communication from weblogs, newsgroups, and chat rooms.

IBM's supercomputer can process about 14,000 web pages per second. The system reads each page, extracts its content, then automatically annotates the material. The tagged pages, often many times the length of the originals, go into a huge data storage array. About 3 billion pages are already in the system.

All this painstakingly labeled information is then available to anyone interested in looking for trends or other valuable insights into what's going on. Users can deploy various software tools, including their own, to analyze the data and dig out relevant patterns and relationships.

[Source: Science News]



Comments

Popular posts from this blog

பறவையே, எங்கு இருக்கிறாய்!

TLDR; If you merely wish for something and do nothing, you may not get it. If you seek with intent, the universe will bring it to you.   முன்னொரு காலத்துல கிம்ப்பியில் (Gympie, QLD) வாழ்ந்தப்ப, ஒரு நாள் காலங்காத்தால 6 மணிக்கு கொக்கரக்கோன்னு கோழி கூவறதுக்கு முன்னால, அந்த பறவையோட பாடலை முதல் முதலாக் கேட்டேன். குரல் ரொம்ப நல்லாவும், பாட்டு வித்தியாசமாவும் இருந்ததால, என்ன பறவையா இருக்கும்னு தூக்கத்தை மறந்து யோசிச்சேன். அந்தப் பறவை எப்படி இருக்கும்னு பார்க்க ஆசையா வந்துந்துச்சு. (கவிதை மொழியில் யாரோ ஒரு பெண்ணை உருவகப்படுத்தல ப்ரோ; சத்தியமா பறக்கிற பறவையேதான்!) அப்புறம், காலைப்பசி வந்ததும், ஆர்வம் பறந்துபோய், இன்னொரு நாள் பாத்துக்கலாம்னு, மூக்கு புடிக்க சாப்டுட்டு, ஆபீஸ் போய்ட்டேன். இது சில, பல நாட்கள் தொடர்ந்தது. பாக்காமலே, அந்த பறவை மேல ஒரு ‘இது’. இதுன்னா, ஒரு ஆர்வம். ஒரு நாள், அந்தப் பறவையை அடையாளம் காண முடியுமான்னு ஆபீஸ் நண்பரிடம், கேட்டேன். ‘பார்க்க எப்படி இருந்துச்சு?’ன்னு அவர் கேக்க;   ‘பார்க்கவே இல்லையே!’ நான் சொல்ல;  ‘குரல் எந்த மாதிரி பேட்டர்ன்’ன்னு திரும்ப அவர் கேட்க,  அடுத்த பதின

அவர்களும், நானும்!

அவர்கள்: “என்னங்க... உங்க வீட்டு டிவி ரொம்ப சிறுசா இருக்கு?” நான்: எங்க வீட்ல பெருசா இருக்கிற 170 இன்ச் புத்தக அலமாரி-யை கவனிச்சீங்களா? அவர்கள்: “XYZ (Private School) பள்ளிக்கூடந்தான் (or ABC டீச்சர்தான்) பெஸ்ட் , என் பொண்ணு அங்கதான் படிக்கிறா..நீங்களும் உங்க பையன அங்க சேத்துடுங்களேன்” நான்: ஸ்கூல் பீஸ் கட்டறீங்கன்னா, இப்பவே நாங்க ரெடி!  அவர்கள்: “கார் வேற பழசாயிடுச்சு, வேற வாங்கிடுங்களேன்..” நான்: நீங்க எப்ப அனுமதி கொடுப்பீங்கன்னுதான், பணப்பையோட காத்துக்கிட்டிருந்தோம், தோ கிளம்பிட்டோம்! அவர்கள்: “வாங்கறதுதான் வாங்கறீங்க..புது காராவே வாங்கிடுங்களேன்...”  நான்: நீங்களே ஒண்ணு வாங்கி கொடுத்துடுங்களேன், நன்றியோடு வாங்கிக்கிறோம். கேஷா... கார்டா... ப்ரோ? அவர்கள்: "வெயிட் குறைக்கிறதெல்லாம் பெரிய மேட்டரே இல்ல ப்ரோ...டெய்லி வெறும் வயித்தில 'ஹாட் வாட்டர் + லெமன் ஜூஸ்' 45 நாள் விடாம குடிங்க.. வேற ஒண்ணும் செய்ய தேவையில்லை...சூப்பர்-ஆ ஸ்லிம் ஆயிடுவீங்க" நான்: வெயிட் குறைக்கிறதுக்கு டிப்ஸ் கேட்டனா நான்...? நான்: “உங்க பையனுக்குத் தமிழ் படிக்க சொல்லிக்

கல் தோன்றி, மண் தோன்றா

  “கல்  தோன்றி,  மண் தோன்றா காலத்தே முன் தோன்றிய மூத்தகுடி தமிழ்க் குடி”  இந்த Punch  Dialogue-ஐ  சொல்லி ஆரம்பிக்கப்பட்டு, கைதட்டல் வாங்கிய தமிழ்ப்  பேச்சுகள் தமிழ் மேடைப் பேச்சு வரலாற்றில் மூவாயிரம் கோடியே முன்னூற்று முப்பத்து மூணு இருக்கும்.   முனைவர் கண்ணபிரான் ரவிசங்கர் (கரச) எழுதிய ‘ அறியப்படாத தமிழ்மொழி ’ என்னும் புத்தகத்தை  படிக்கும்வரை நானும் ஏதோ ஒரு புலவர்  பிற்காலத்தில் வரப்போற, ‘ஓங்கி அடிச்சா  ஒன்றரை டன்ன்னுடா’க்கு கைதட்டி குதுகலிக்கும் தமிழ் மக்களுக்கு புகழ்ச்சி புடிக்கும்ன்னு இதை எழுதி வைச்சிட்டு போயிட்டாரோன்னு கடந்து போயிருக்கேன்.   அதெப்படி? கல்,  மண் தோன்றுமுன்னே தமிழ்க் குடிமக்கள் பிறந்து விட்டார்களா? இல்ல, தமிழ் மொழி மற்ற மொழிகளை  விட அவ்வளவு பழமையானதா? ன்னு  ஆராய்ச்சி செஞ்சு புத்தகத்தின் முதல் கட்டுரையாக  எழுதி இருக்கார் கரச (https://twitter.com/kryes)   சரி,  எங்கே  இருந்து வந்தது இந்த இரண்டு வரிகள்? ஐயனாரிதனர் என்பவர் எழுதிய புறப்பொருள் வெண்பா மாலை என்ற இலக்கண நூலில் வரும் பாடல்தான் அது.  பொய் அகல, நாளும் புகழ் விளைத்தல் என் வியப்பாம்?  வையகம் போர்த்த, வயங்கு ஒலிநீ