Aktuelles
Digital Eliteboard - Das Digitale Technik Forum

Registriere dich noch heute kostenlos, um Mitglied zu werden! Sobald du angemeldet bist, kannst du auf unserer Seite aktiv teilnehmen, indem du deine eigenen Themen und Beiträge erstellst und dich über deinen eigenen Posteingang mit anderen Mitgliedern unterhalten kannst! Zudem bekommst du Zutritt zu Bereichen, welche für Gäste verwehrt bleiben

Registriere dich noch heute kostenlos, um Mitglied zu werden! Sobald du angemeldet bist, kannst du auf unserer Seite aktiv teilnehmen, indem du deine eigenen Themen und Beiträge erstellst und dich über deinen eigenen Posteingang mit anderen Mitgliedern unterhalten kannst! Zudem bekommst du Zutritt zu Bereichen, welche für Gäste verwehrt bleiben

Wie kann ich Urls aus einer Datei filtern - Script?!

Badly

Spezialist
Registriert
15. September 2007
Beiträge
589
Reaktionspunkte
113
Punkte
1.345
Hi ich würde gerne die Urls aus einer Datei filtern, in der auch alles andere drin ist. Die scripts sollen untereinander in einer zweiten Datei ausgegeben werden.
Ich habe schon mittels KI versucht selbst was zu basteln , bewusst basteln, da ich nicht programmieren kann.
Aber spätestens nach dem einlesen gibts immer fehler und das script bricht ab.

Könnte einer von Euch weiterhelfen und so ein Script zur Verfügung stellen?
Lieben Dank
 
Hallo Badly,

es ist verständlich, dass das Filtern von URLs aus einer Datei eine Herausforderung darstellen kann, insbesondere wenn man nicht viel Erfahrung im Programmieren hat. Ich kann dir gerne ein einfaches Skript zur Verfügung stellen, das du verwenden kannst, um URLs aus einer Datei zu extrahieren und in einer zweiten Datei zu speichern. Ich werde ein Beispiel in Python geben, da es eine benutzerfreundliche Sprache ist und leicht zu verstehen.

Hier ist ein einfaches Skript, das genau das macht, was du brauchst:

Python:
import re

def extract_urls(input_file, output_file):
    try:
        # Öffne die Eingabedatei und lese den Inhalt
        with open(input_file, 'r') as file:
            content = file.read()
        
        # Verwende einen regulären Ausdruck, um URLs zu finden
        urls = re.findall(r'https?://[^\s]+', content)
        
        # Schreibe die gefundenen URLs in die Ausgabedatei
        with open(output_file, 'w') as file:
            for url in urls:
                file.write(url + '\n')

        print(f"Es wurden {len(urls)} URLs gefunden und in '{output_file}' gespeichert.")
    
    except Exception as e:
        print(f"Ein Fehler ist aufgetreten: {e}")

# Beispielaufruf des Skripts
input_file = 'input.txt'  # Passe den Namen der Eingabedatei an
output_file = 'output.txt'  # Passe den Namen der Ausgabedatei an
extract_urls(input_file, output_file)

### Anleitung zur Verwendung:

1. Installiere Python: Stelle sicher, dass du Python installiert hast. Du kannst es von der offiziellen herunterladen.

2. Erstelle die Dateien:
- Erstelle eine Textdatei namens input.txt in demselben Verzeichnis wie das Skript. Füge die Daten, aus denen du die URLs extrahieren möchtest, in diese Datei ein.
- Das Skript wird die extrahierten URLs in eine Datei namens output.txt schreiben.

3. Führe das Skript aus:
- Speichere den obigen Code in einer Datei mit der Endung .py, z.B. url_extractor.py.
- Öffne die Kommandozeile oder das Terminal und navigiere zu dem Verzeichnis, in dem sich das Skript befindet, und führe es mit dem Befehl python url_extractor.py aus.

### Hinweise:

  • Der reguläre Ausdruck https?://[^\s]+ sucht nach URLs, die mit http oder https beginnen und betrachtet alles bis zum nächsten Leerzeichen.
  • Wenn du andere Arten von URLs (z.B. FTP-Links) filtern möchtest, kannst du den regulären Ausdruck entsprechend anpassen.

Wenn du auf Probleme stößt oder weitere Anpassungen benötigst, lass es mich einfach wissen! Viel Erfolg!
 
ok habs doch selbst hinbekommen
anbei die ergebnisse.
einmal nur filtern aller http oder https links aus einer datei und
einmal http oder https inkl. der dazugehörigen mac
 

Anhänge

Du musst angemeldet sein, um die Anhangsliste zu sehen.
Zuletzt bearbeitet:
Aus den ganzen Download txt von überall gesammelt, fische ich mir die m3u auch per py raus. Sinnvoll ist, direkt die Zeilen wegzulassen, die nicht username (Username) oder nicht m3u in der Zeile haben oder aber xmltv drin haben.
 
Zurück
Oben