אולי אתה צריך ליצור רשימה של מילים לא רלוונטיות כמו "גם", "הוא", "היא" וכדומה... שלא נותנים לך אינדיקציה לכלום ואז לרוץ על הפסקה הראשונה בנוסף לכותרת - כי בד"כ שם יש אינפורמציה שרלוונטי.אגב, כל כתבה מסווגת לתת תחום(קרי כלכלה) ואני מניח שיש לה מילות מפתח איפשהו(תסתכל ב HTML שיורד אלייך בזמן בקשה לידיעה). השוואה של מילות קישור + תת תחום יכולים לסגור לך את הפינה בצורה סבירה.
אולי גם שעת פרסום המודעה תעלה רלוונטיות(כלומר אם יש חפיפה של כמה דקות בין פרסום לפרסום, מה שבד"כ קורה שיש תחרות באתרי חדשות, אז זה מגדיל את הסיכוי לכתבה קשורה).