chenke
חבר מתאריך 1.7.02
730 הודעות, דרג אמינות חבר זה |
09:36 15.08.07 |

|
זיהוי לינקים בדף HTML. (VB6)
| |
שלום לכולם, אני עובד ב- VB6 ובתוכנה שאני כותב, אני מוריד דף HTML וצריך לשלוף ממנו את כל הלינקים. אני יודע לעשות זאת חיפוש של המחרוזת "href=", ואני אכן מצליח לאסוף את הלינקים, אבל הבעייה שלי היא עם הלינקים הייחסים. בלינק יחסי, אני מתכוןן שהלינק הייחסי של http://news.walla.co.il/?w=/1/1 1154100, יופיע בקוד ה- HTML בתור /?w=//1154100. אני צריך את הלינק המלא ולא את היחסי, ולכן השתמשתי בשיטה שבה אני לוקח את הכתובת של דף ה- HTML (בדוגמא שציינתי http://news.walla.co.il/), לוקח ממנה את החלק שעד הקיו הנטוי הראשון ואליו משרשר את הלינק היחסי. השיטה הזאת עובדת בחלק מהאתרים, ובחלק לא עובדת (לדוגמא ב- YNET זה לא עובד), ולכן אני שואל אם למשהוא יש רעיון אחר. אני יודע שקיימת שיטה ע"י שימוש בפקודה: Set objDoc = objMSHTML.createDocumentFromUrl(strURL, vbNullString) ואז שימוש באוסף ה- link שלו, אבל השיטה הזאת לא טובה לי, כיוון שהיא איטית מדי (היא מצריכה את טעינת הדף מהרשת, על כל התמונות, האובייקטים והחלונות הקופצים שלו), וגוזלת יותר מדי זיכרון. אז למשהוא יש רעיון? חן.
|
|
שתף
|
מכתב זה והנלווה אליו, על אחריות ועל דעת הכותב בלבד
|
| |
|