Skip to main content

Reading Web Tea Leaves

BM recently launched WebFountain, an ambitious commercial service that mines valuable information from about half of the web's content, including informal communication from weblogs, newsgroups, and chat rooms.

IBM's supercomputer can process about 14,000 web pages per second. The system reads each page, extracts its content, then automatically annotates the material. The tagged pages, often many times the length of the originals, go into a huge data storage array. About 3 billion pages are already in the system.

All this painstakingly labeled information is then available to anyone interested in looking for trends or other valuable insights into what's going on. Users can deploy various software tools, including their own, to analyze the data and dig out relevant patterns and relationships.

[Source: Science News]



Comments

Popular posts from this blog

அவர்களும், நானும்!

அவர்கள்: “என்னங்க... உங்க வீட்டு டிவி ரொம்ப சிறுசா இருக்கு?” நான்: எங்க வீட்ல பெருசா இருக்கிற 170 இன்ச் புத்தக அலமாரி-யை கவனிச்சீங்களா? அவர்கள்: “XYZ (Private School) பள்ளிக்கூடந்தான் (or ABC டீச்சர்தான்) பெஸ்ட் , என் பொண்ணு அங்கதான் படிக்கிறா..நீங்களும் உங்க பையன அங்க சேத்துடுங்களேன்” நான்: ஸ்கூல் பீஸ் கட்டறீங்கன்னா, இப்பவே நாங்க ரெடி!  அவர்கள்: “கார் வேற பழசாயிடுச்சு, வேற வாங்கிடுங்களேன்..” நான்: நீங்க எப்ப அனுமதி கொடுப்பீங்கன்னுதான், பணப்பையோட காத்துக்கிட்டிருந்தோம், தோ கிளம்பிட்டோம்! அவர்கள்: “வாங்கறதுதான் வாங்கறீங்க..புது காராவே வாங்கிடுங்களேன்...”  நான்: நீங்களே ஒண்ணு வாங்கி கொடுத்துடுங்களேன், நன்றியோடு வாங்கிக்கிறோம். கேஷா... கார்டா... ப்ரோ? அவர்கள்: "வெயிட் குறைக்கிறதெல்லாம் பெரிய மேட்டரே இல்ல ப்ரோ...டெய்லி வெறும் வயித்தில 'ஹாட் வாட்டர் + லெமன் ஜூஸ்' 45 நாள் விடாம குடிங்க.. வேற ஒண்ணும் செய்ய தேவையில்லை...சூப்பர்-ஆ ஸ்லிம் ஆயிடுவீங்க" நான்: வெயிட் குறைக்கிறதுக்கு டிப்ஸ் கேட்டனா நான்...? நான்: “உங்க பையனுக்குத் தமிழ் படிக்க சொல்லிக்

பறவையே, எங்கு இருக்கிறாய்!

TLDR; If you merely wish for something and do nothing, you may not get it. If you seek with intent, the universe will bring it to you.   முன்னொரு காலத்துல கிம்ப்பியில் (Gympie, QLD) வாழ்ந்தப்ப, ஒரு நாள் காலங்காத்தால 6 மணிக்கு கொக்கரக்கோன்னு கோழி கூவறதுக்கு முன்னால, அந்த பறவையோட பாடலை முதல் முதலாக் கேட்டேன். குரல் ரொம்ப நல்லாவும், பாட்டு வித்தியாசமாவும் இருந்ததால, என்ன பறவையா இருக்கும்னு தூக்கத்தை மறந்து யோசிச்சேன். அந்தப் பறவை எப்படி இருக்கும்னு பார்க்க ஆசையா வந்துந்துச்சு. (கவிதை மொழியில் யாரோ ஒரு பெண்ணை உருவகப்படுத்தல ப்ரோ; சத்தியமா பறக்கிற பறவையேதான்!) அப்புறம், காலைப்பசி வந்ததும், ஆர்வம் பறந்துபோய், இன்னொரு நாள் பாத்துக்கலாம்னு, மூக்கு புடிக்க சாப்டுட்டு, ஆபீஸ் போய்ட்டேன். இது சில, பல நாட்கள் தொடர்ந்தது. பாக்காமலே, அந்த பறவை மேல ஒரு ‘இது’. இதுன்னா, ஒரு ஆர்வம். ஒரு நாள், அந்தப் பறவையை அடையாளம் காண முடியுமான்னு ஆபீஸ் நண்பரிடம், கேட்டேன். ‘பார்க்க எப்படி இருந்துச்சு?’ன்னு அவர் கேக்க;   ‘பார்க்கவே இல்லையே!’ நான் சொல்ல;  ‘குரல் எந்த மாதிரி பேட்டர்ன்’ன்னு திரும்ப அவர் கேட்க,  அடுத்த பதின

Flickr Hacks:5 Tips get into "Flickr Explore" page!

As you know, Flickr uses an algorithm to choose the best 500 photos every day and post them on Flickr Explore page. This mesmerizing collection is done auto' magic 'ally by an "interestingness algorithm" which rates each photo how good it is. It does by considering lot of factors such as who views, who comments and who favourites a photo. It is not most views, most favourites or most comments. Here's what Flickr says: "There are lots of things that make a photo 'interesting' (or not) in the Flickr. Where the clickthroughs are coming from; who comments on it and when; who marks it as a favorite; its tags and many more things which are constantly changing. Interestingness changes over time, as more and more fantastic photos and stories are added to Flickr." As I tried to crack down this interestingness puzzle, I figured out certain shortcuts by which you can get to the Flickr Explore page. Get this basics straight . Favourites matter m