אני כבר תקופה די ארוכה לא בעניינים, אשמח לטיפה הכוונה, אני מנסה לבנות סקריפט שיוכל לסרוק דפים מוגדרים מראש, ובמידה ונוסף קישור חדש, הוא ישמור אותו. אני אשמח לכל הכוונה בנושא, אני כותב בPHP. חשבתי לשמור העתק של הדף בDB או משהו, וכל פעם להשוות באמצעות הסקריפט (שירוץ עם cron jobs או בצורה ידנית), ואם יש שינוי, הוא יחפש את מה שנמצא אחרי תגית href או איזשהיא תבנית מוגדרת מראש, והוא ידע להעתיק את הקישור. אני לא מצליח לבנות סקריפט כזה, כי הוא תמיד מתפקשש לי בשלב סריקת הדף. ואין לי מושג איך אפשר לבצע הדמיה כאילו הסקריפט הוא בעצם משתמש שרוצה להוריד אליו (לשרת) את הקובץ.
תודה רבה חברים
אפשרויות ניהול
ליל קיץ
23.01.1200:28
1. LONGSHOTבתגובה להודעה מספר 0
קשה להגיד כי אנחנו לא יודעים איך הדף בנוי, איך הלינקים מסודרים - ומה מהם אתה בדיוק רוצה להוריד.
בגדול הכיוון הוא לקבל את תוכן הדף עם CURL או כל אמצעי אחר שתרצה, לבצע סריקה של הלינקים בעזרת ביטוי רגולארי שיחזיר לך את הלינקים הרלוונטים (PREG MATCH ALL).
לא רואה טעם לשמור כל פעם את כל תוכן העמוד, תעבור לינק לינק בלולואה ושמור אותם ב DB - כל פעם תבדוק אם הלינק כבר קיים - במידה ולא, תכניס.
בשביל ביטויים רגולארים אני ממליץ על אפליקציית פלאש נחמדה בשם RegExr http://gskinner.com/RegExr/? מעבר לזה שזה כלי אדיר לבדוק ביטויים רגולארים על מחרוזות, יש שם בצד ימין תפריט שתוכל לחפש ביטויים שגולשים כבר העלו. אם תחפש HREF למשל, תוכל למצוא ביטוי רגולארי מוכן שיידע להוציא לך את התוכן בין המרכאות. אחר כך כדי להתאים אותו לקוד שלך ולעשות שינויים זה כבר שטויות בעזרת הכלי הזה.
asco88
23.01.1206:39
2. סבבה, אבל איך אני מבצע שמירה של הקובץ על השרת?בתגובה להודעה מספר 1
מדובר סה"כ בקבצי WORD לא גדולים. אגב אתר חזק.
תודה רבה.
ליל קיץ
23.01.1209:39
3. אתה לא צריך באמת לשמור אותו פיזיתבתגובה להודעה מספר 2