wikked: wikked/fs.py annotate

annotate wikked/fs.py @ 0:c946f4facfa2

Initial commit.

author	Ludovic Chabant <ludovic@chabant.com>
date	Mon, 10 Dec 2012 22:40:52 -0800
parents
children	59cad6ce1a1c

rev	line source
0 c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	1 import os
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	2 import os.path
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	3 import re
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	4 import string
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	5
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	6
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	7 class PageNotFoundError(Exception):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	8 """ An error raised when no physical file
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	9 is found for a given URL.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	10 """
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	11 pass
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	12
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	13
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	14 class FileSystem(object):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	15 """ A class responsible for mapping page URLs to
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	16 file-system paths, and for scanning the file-system
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	17 to list existing pages.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	18 """
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	19 def __init__(self, root):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	20 self.root = root
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	21 self.excluded = []
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	22
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	23 def getPageNames(self, subdir=None):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	24 basepath = self.root
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	25 if subdir is not None:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	26 basepath = self.getPhysicalNamespacePath(subdir)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	27
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	28 for dirpath, dirnames, filenames in os.walk(basepath):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	29 dirnames[:] = [d for d in dirnames if os.path.join(dirpath, d) not in self.excluded]
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	30 for filename in filenames:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	31 path = os.path.join(dirpath, filename)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	32 path_split = os.path.splitext(os.path.relpath(path, self.root))
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	33 if path_split[1] != '':
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	34 yield path_split[0]
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	35
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	36 def getPage(self, url):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	37 path = self.getPhysicalPagePath(url)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	38 with open(path, 'r') as f:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	39 content = f.read()
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	40 name = os.path.basename(path)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	41 name_split = os.path.splitext(name)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	42 return {
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	43 'url': url,
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	44 'path': path,
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	45 'name': name_split[0],
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	46 'ext': name_split[1],
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	47 'content': content
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	48 }
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	49
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	50 def getPhysicalNamespacePath(self, url):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	51 return self._getPhysicalPath(url, False)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	52
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	53 def getPhysicalPagePath(self, url):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	54 return self._getPhysicalPath(url, True)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	55
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	56 def _getPhysicalPath(self, url, is_file):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	57 if string.find(url, '..') >= 0:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	58 raise ValueError("Page URLs can't contain '..': " + url)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	59
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	60 # For each "part" in the given URL, find the first
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	61 # file-system entry that would get slugified to an
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	62 # equal string.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	63 current = self.root
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	64 parts = url.lower().split('/')
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	65 for i, part in enumerate(parts):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	66 names = os.listdir(current)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	67 for name in names:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	68 name_formatted = re.sub(r'[^A-Za-z0-9_\.\-\(\)]+', '-', name.lower())
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	69 if is_file and i == len(parts) - 1:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	70 # If we're looking for a file and this is the last part,
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	71 # look for something similar but with an extension.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	72 if re.match("%s\.[a-z]+" % re.escape(part), name_formatted):
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	73 current = os.path.join(current, name)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	74 break
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	75 else:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	76 if name_formatted == part:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	77 current = os.path.join(current, name)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	78 break
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	79 else:
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	80 # Failed to find a part of the URL.
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	81 raise PageNotFoundError("No such page: " + url)
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	82 return current
c946f4facfa2 Initial commit. Ludovic Chabant <ludovic@chabant.com> parents: diff changeset	83

Mercurial > wikked

annotate wikked/fs.py @ 0:c946f4facfa2