어디에서 생성 날짜별로 정렬 된 디렉토리 목록을 어떻게 얻습니까?
날짜별로 분류 된 디렉토리의 모든 파일 목록을 얻는 가장 좋은 방법은 무엇입니까 [만든 | 수정 됨], python을 사용하여 Windows 시스템에서?
다음은 @Greg Hewgill
의 답변에 대한 보다 자세한 버전입니다 . 질문 요구 사항을 가장 잘 준수합니다. 생성 날짜와 수정 날짜를 구분합니다 (적어도 Windows에서는).
#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time
# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)
# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date
# but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
for cdate, path in sorted(entries):
print time.ctime(cdate), os.path.basename(path)
예 :
$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py
이전에 Python 펼쳐가 디렉터리에서 마지막으로 업데이트 된 파일을 확인하기 위해이 작업을 수행했습니다.
import glob
import os
search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list
# of files (presumably not including directories)
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))
파일 mtime을 기반으로 원하는 것을 수행해야합니다.
편집 : 원하는 경우 glob.glob () 대신 os.listdir ()을 사용할 수 있습니다. 원래 코드에서 glob을 사용하여 특정 세트가있는 파일 만 검색하기를 원합니다. glob ()이 더 파일 파일의. listdir을 사용하는 방법은 다음과 같습니다.
import os
search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))
os.path.getmtime
에포크 이후 초 수를 제공 하는 함수가 표시 os.stat
됩니다.
import os
os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)
내 버전은 다음과 달라집니다.
def getfiles(dirpath):
a = [s for s in os.listdir(dirpath)
if os.path.isfile(os.path.join(dirpath, s))]
a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
return a
먼저 파일 이름 목록을 작성합니다. isfile ()은 디렉토리를 건너 뛰는 데 사용됩니다. 디렉토리를 포함해야하는 경우 생략 할 수 있습니다. 그런 다음 수정 날짜를 키로 사용하여 목록을 제자리에 정렬합니다.
다음은 한 줄짜리입니다.
import os
import time
from pprint import pprint
pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])
이것은 os.listdir ()을 호출하여 파일 이름 목록을 가져온 다음 각각에 대해 os.stat ()를 호출하여 생성 시간을 얻은 다음 생성 시간에 대해 정렬합니다.
이 메서드는 각 파일에 대해 os.stat ()를 한 번만 호출하므로 정렬에서 각 비교를 위해 호출하는 것보다 더 효율적입니다.
디렉토리 변경없이 :
import os
path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)
print time_sorted_list
# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list
날짜 순서 (Python 3)에서 특정 확장자를 가진 파일을 읽으려면 필터없이 glob을 사용하는 내 대답입니다.
dataset_path='/mydir/'
files = glob.glob(dataset_path+"/morepath/*.extension")
files.sort(key=os.path.getmtime)
Python 3.5 이상
from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.stat(p).st_mtime)
os.walk('.').next()[-1]
로 필터링 하는 대신 사용할 수 os.path.isfile
있지만 목록에 죽은 심볼릭 링크가 남아 있으며 os.stat
실패합니다.
이것은 학습을위한 기본 단계입니다.
import os, stat, sys
import time
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'
listdir = os.listdir(dirpath)
for i in listdir:
os.chdir(dirpath)
data_001 = os.path.realpath(i)
listdir_stat1 = os.stat(data_001)
listdir_stat2 = ((os.stat(data_001), data_001))
print time.ctime(listdir_stat1.st_ctime), data_001
Alex Coventry의 대답은 파일이 존재하지 않는 파일에 대한 심볼릭 링크 인 경우 예외를 생성하며 다음 코드는 해당 대답을 수정합니다.
import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')),
key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())
파일이 존재하지 않으면 now ()가 사용되고 심볼릭 링크는 목록의 맨 끝으로 이동합니다.
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time
import glob,os
lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))
다음은 확장을 찾고 정렬 옵션을 제공하는 간단한 몇 줄입니다.
def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False):
files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
return files_to_evaluate
완전성을 위해 os.scandir
(2 배 더 빠름 pathlib
) :
import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)
쉘 명령을 사용해야 할 수도 있습니다. Unix / Linux에서 find piped with sort는 아마도 원하는 것을 할 수있을 것입니다.
'IT' 카테고리의 다른 글
검증되지 않은 예외 오류입니까? (0) | 2020.08.13 |
---|---|
'for'루프 내부의 'for'루프가 동일한 카운터 변수 이름을 사용할 수 있습니까? (0) | 2020.08.13 |
세그먼트에 숫자를 제한하는 가장 우아한 방법은 무엇입니까? (0) | 2020.08.13 |
품질 성능없이 이미지 크기 조정 (0) | 2020.08.13 |
Visual Studio 2015 프로젝트 빌드가 실패했지만 오류 없음 (0) | 2020.08.13 |