υπάρχει αυτό εδώ https://ia600105.us.archive.org/18/items/PatrologiaGraeca/
το οποίο έχει μερικές χιλιάδες pdf αρχεία τα οποία χρειάζομαι.
προσπαθω με wget
ότι κιαν προσπάθησα από googling τρώγω πόρτα.
wget --user-agent='Mozilla/4.0' -c $(for website in $(cat websites_list); do lynx -cache=0 -dump -listonly "$website" | awk '/.pdf$/{print $2}';done)
--2022-01-23 11:08:54-- https://ia600105.us.archive.org/18/items/PatrologiaGraeca/K%CE%BB%CE%B5%CE%B9%CF%82
Resolving ia600105.us.archive.org (ia600105.us.archive.org)... 207.241.227.245
Connecting to ia600105.us.archive.org (ia600105.us.archive.org)|207.241.227.245|:443... connected.
HTTP request sent, awaiting response... 404 Not Found
2022-01-23 11:08:56 ERROR 404: Not Found.
--2022-01-23 11:08:56-- https://ia600105.us.archive.org/18/items/PatrologiaGraeca/K%CE%BB%CE%B5%CE%B9%CF%82
Reusing existing connection to ia600105.us.archive.org:443.
HTTP request sent, awaiting response... No data received.
Retrying.
wget --user-agent='Mozilla/4.0' --no-directories --content-disposition -e robots=off -A.pdf -r \ https://ia600105.us.archive.org/18/items/PatrologiaGraeca/
https://ia600105.us.archive.org/18/items/PatrologiaGraeca/: Scheme missing.
wget --user-agent='Mozilla/4.0' --no-directories --content-disposition -e robots=off -A.pdf -r -c $(for website in $(cat websites_list); do lynx -cache=0 -dump -listonly "$website" | awk '/.pdf$/{print $2}';done)
--2022-01-23 11:15:46-- https://ia600105.us.archive.org/18/items/PatrologiaGraeca/K%CE%BB%CE%B5%CE%B9%CF%82
Resolving ia600105.us.archive.org (ia600105.us.archive.org)... 207.241.227.245
Connecting to ia600105.us.archive.org (ia600105.us.archive.org)|207.241.227.245|:443... connected.
HTTP request sent, awaiting response... 404 Not Found
2022-01-23 11:15:47 ERROR 404: Not Found.
--2022-01-23 11:15:47-- https://ia600105.us.archive.org/18/items/PatrologiaGraeca/K%CE%BB%CE%B5%CE%B9%CF%82
Reusing existing connection to ia600105.us.archive.org:443.
HTTP request sent, awaiting response... 404 Not Found
2022-01-23 11:15:47 ERROR 404: Not Found.
προφανώς τα έχω κάνει σαλάτα!
υπάρχει κάποιος τρόπος να κατεβάσω με wget τα pdf αρχεία μόνο από αυτήν την σελίδα;
Επίσης έχω μια εναλακτική να κατεβάσω από εδώ
http://khazarzar.skeptik.net/pgm/PG_Migne/
αλλά ο κάθε κατάλογος οδηγεί σε άλλο κατάλογο που περιέχει ΚΑΙ τα pdf αρχεία που θέλω , και δεν γνωρίζω πως να το κάνω.
πρόκειται για χιλιάδες αρχεία που δεν μπορώ να κατεβάσω χειροκίνητα σε αυτήν την ζωή…
ευχαριστώ.