wikked: wikked/fs.py annotate

annotate wikked/fs.py @ 24:8a83b0e91633

The wiki `fs` only scans known file extensions. Those file extensions are provided by the registered formatters.

author	Ludovic Chabant <ludovic@chabant.com>
date	Fri, 04 Jan 2013 16:02:46 -0800
parents	67c150d5ed53
children	2b35d719f342

rev	line source
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	1 import os
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	2 import os.path
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	3 import re
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	4 import string
24 8a83b0e91633 The wiki `fs` only scans known file extensions. Ludovic Chabant <ludovic@chabant.com> parents: 18 diff changeset	5 import codecs
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	6
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	7
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	8 class PageNotFoundError(Exception):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	9 """ An error raised when no physical file
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	10 is found for a given URL.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	11 """
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	12 pass
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	13
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	14
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	15 class FileSystem(object):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	16 """ A class responsible for mapping page URLs to
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	17 file-system paths, and for scanning the file-system
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	18 to list existing pages.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	19 """
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	20 def __init__(self, root):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	21 self.root = root
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	22 self.excluded = []
24 8a83b0e91633 The wiki `fs` only scans known file extensions. Ludovic Chabant <ludovic@chabant.com> parents: 18 diff changeset	23 self.page_extensions = None
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	24
3 59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	25 def getPageInfos(self, subdir=None):
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	26 basepath = self.root
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	27 if subdir is not None:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	28 basepath = self.getPhysicalNamespacePath(subdir)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	29
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	30 for dirpath, dirnames, filenames in os.walk(basepath):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	31 dirnames[:] = [d for d in dirnames if os.path.join(dirpath, d) not in self.excluded]
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	32 for filename in filenames:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	33 path = os.path.join(dirpath, filename)
8 793234411100 Fixed Mercurial files incorrectly included as pages. Ludovic Chabant <ludovic@chabant.com> parents: 3 diff changeset	34 if path in self.excluded:
793234411100 Fixed Mercurial files incorrectly included as pages. Ludovic Chabant <ludovic@chabant.com> parents: 3 diff changeset	35 continue
18 67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	36 page_info = self.getPageInfo(path)
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	37 if page_info is not None:
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	38 yield page_info
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	39
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	40 def getPageInfo(self, path):
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	41 for e in self.excluded:
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	42 if path.startswith(e):
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	43 return None
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	44 return self._getPageInfo(path)
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	45
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	46 def getPage(self, url):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	47 path = self.getPhysicalPagePath(url)
24 8a83b0e91633 The wiki `fs` only scans known file extensions. Ludovic Chabant <ludovic@chabant.com> parents: 18 diff changeset	48 with codecs.open(path, 'r', encoding='utf-8') as f:
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	49 content = f.read()
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	50 name = os.path.basename(path)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	51 name_split = os.path.splitext(name)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	52 return {
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	53 'url': url,
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	54 'path': path,
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	55 'name': name_split[0],
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	56 'ext': name_split[1],
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	57 'content': content
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	58 }
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	59
3 59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	60 def pageExists(self, url):
59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	61 try:
59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	62 self.getPhysicalPagePath(url)
59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	63 return True
59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	64 except PageNotFoundError:
59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	65 return False
59cad6ce1a1c Added support for history and diffing. Ludovic Chabant <ludovic@chabant.com> parents: 0 diff changeset	66
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	67 def getPhysicalNamespacePath(self, url):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	68 return self._getPhysicalPath(url, False)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	69
18 67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	70 def _getPageInfo(self, path):
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	71 rel_path = os.path.relpath(path, self.root)
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	72 rel_path_split = os.path.splitext(rel_path)
24 8a83b0e91633 The wiki `fs` only scans known file extensions. Ludovic Chabant <ludovic@chabant.com> parents: 18 diff changeset	73 if self.page_extensions is not None and rel_path_split[1] not in self.page_extensions:
18 67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	74 return None
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	75 url = re.sub(r'[^A-Za-z0-9_\.\-\(\)/]+', '-', rel_path_split[0].lower())
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	76 return {
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	77 'url': url,
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	78 'path': path,
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	79 'name': rel_path_split[0],
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	80 'ext': rel_path_split[1]
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	81 }
67c150d5ed53 Added ability to get a single page's info from the file-system. Ludovic Chabant <ludovic@chabant.com> parents: 8 diff changeset	82
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	83 def getPhysicalPagePath(self, url):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	84 return self._getPhysicalPath(url, True)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	85
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	86 def _getPhysicalPath(self, url, is_file):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	87 if string.find(url, '..') >= 0:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	88 raise ValueError("Page URLs can't contain '..': " + url)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	89
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	90 # For each "part" in the given URL, find the first
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	91 # file-system entry that would get slugified to an
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	92 # equal string.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	93 current = self.root
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	94 parts = url.lower().split('/')
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	95 for i, part in enumerate(parts):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	96 names = os.listdir(current)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	97 for name in names:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	98 name_formatted = re.sub(r'[^A-Za-z0-9_\.\-\(\)]+', '-', name.lower())
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	99 if is_file and i == len(parts) - 1:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	100 # If we're looking for a file and this is the last part,
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	101 # look for something similar but with an extension.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	102 if re.match("%s\.[a-z]+" % re.escape(part), name_formatted):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	103 current = os.path.join(current, name)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	104 break
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	105 else:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	106 if name_formatted == part:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	107 current = os.path.join(current, name)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	108 break
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	109 else:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	110 # Failed to find a part of the URL.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	111 raise PageNotFoundError("No such page: " + url)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	112 return current
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	113

Mercurial > wikked

annotate wikked/fs.py @ 24:8a83b0e91633