Hallo Badly,
es ist verständlich, dass das Filtern von URLs aus einer Datei eine Herausforderung darstellen kann, insbesondere wenn man nicht viel Erfahrung im Programmieren hat. Ich kann dir gerne ein einfaches Skript zur Verfügung stellen, das du verwenden kannst, um URLs aus einer Datei zu extrahieren und in einer zweiten Datei zu speichern. Ich werde ein Beispiel in Python geben, da es eine benutzerfreundliche Sprache ist und leicht zu verstehen.
Hier ist ein einfaches Skript, das genau das macht, was du brauchst:
Python:
import re
def extract_urls(input_file, output_file):
try:
# Öffne die Eingabedatei und lese den Inhalt
with open(input_file, 'r') as file:
content = file.read()
# Verwende einen regulären Ausdruck, um URLs zu finden
urls = re.findall(r'https?://[^\s]+', content)
# Schreibe die gefundenen URLs in die Ausgabedatei
with open(output_file, 'w') as file:
for url in urls:
file.write(url + '\n')
print(f"Es wurden {len(urls)} URLs gefunden und in '{output_file}' gespeichert.")
except Exception as e:
print(f"Ein Fehler ist aufgetreten: {e}")
# Beispielaufruf des Skripts
input_file = 'input.txt' # Passe den Namen der Eingabedatei an
output_file = 'output.txt' # Passe den Namen der Ausgabedatei an
extract_urls(input_file, output_file)
### Anleitung zur Verwendung:
1.
Installiere Python: Stelle sicher, dass du Python installiert hast. Du kannst es von der offiziellen
Sie müssen registriert sein, um Links zu sehen.
herunterladen.
2.
Erstelle die Dateien:
- Erstelle eine Textdatei namens
input.txt in demselben Verzeichnis wie das Skript. Füge die Daten, aus denen du die URLs extrahieren möchtest, in diese Datei ein.
- Das Skript wird die extrahierten URLs in eine Datei namens
output.txt schreiben.
3.
Führe das Skript aus:
- Speichere den obigen Code in einer Datei mit der Endung
.py, z.B.
url_extractor.py.
- Öffne die Kommandozeile oder das Terminal und navigiere zu dem Verzeichnis, in dem sich das Skript befindet, und führe es mit dem Befehl
python url_extractor.py aus.
### Hinweise:
- Der reguläre Ausdruck
https?://[^\s]+ sucht nach URLs, die mit http oder https beginnen und betrachtet alles bis zum nächsten Leerzeichen.
- Wenn du andere Arten von URLs (z.B. FTP-Links) filtern möchtest, kannst du den regulären Ausdruck entsprechend anpassen.
Wenn du auf Probleme stößt oder weitere Anpassungen benötigst, lass es mich einfach wissen! Viel Erfolg!