05.2023 | pandas | Python | ftekst()
Wyliczenie ilości linii, słów i znaków z podanego pliku tekstowego
Niniejszy tip przedstawia sposób na wyliczenie ilości linii, słów i znaków w podanym pliku tekstowym.
Zakładamy, że dane są w pliku tekstowym, a plik ten jest podany jako argument przy wywołaniu naszego skryptu.
sys.arg[1]
=> pobranie argumentu, czyli nazwy plikuopen('file_name', 'r')
=> otwarcie pliku do odczytuf.read()
=> wczytanie zawartości plikulen(txt)
=> zwraca ilość elementów w podanym obiekcietxt.split()
=> rozbija blok tekstowy na pojedyncze słowatxt.splitlines()
=> rozbija blok tekstowy na pojedyncze linieUwaga:
Poszczególne fragmenty pliku wyglądają następująco:
# importujemy moduł sys
import sys
# pobieramy nazwę pliku
arg1 = sys.argv[1]
# otwieramy plik
f = open(arg1, "r")
ftekst = f.read()
# definiujemy zmienne
c = 0 # number of chars
w = 0 # number od words
l = 0 # number of lines
# wyliczamy ilość znaków w pliku
for element in ftekst:
c = c + 1
print("Ilość znaków to: " + str(c))
# wyliczamy ilość słów
w = ftekst.split()
w = len(w)
print("Ilość słów to: " + str(w))
# wyliczamy ilość linii
l = len(ftekst.splitlines())
print("Ilość linii to: " + str(l))
Wdrażam rozwiązania analityczne, buduję raporty zarządcze i pomagam zrozumieć dane.
Korzystam z Google Marketing Cloud, Microsoft Power BI, Google Cloud oraz Python.
Pracowałem m.in. dla Credit Suisse, Phonak, Hansaton, Unitron, Nestle, IBM, Play.
Jestem współtwórcą grupy Hexe Capital SA.
Zapraszam do lektury i współpracy.
Krzysztof Surowiecki
Chcę porozmawiać o współpracy →Moje certyfikaty